2011 Fiscal Year Annual Research Report
科学と技術のリンケージの分析を可能とする情報基盤整備に向けた基礎的研究
Project/Area Number |
22500848
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
調 麻佐志 東京工業大学, 大学院・理工学研究科, 准教授 (00273061)
|
Keywords | 科学計量学 / 特許分析 / データベース |
Research Abstract |
先行研究(調、2008)において作成した1995年から2005年に登録された米国特許内の非特許引用文献データからSCI内に収録された学術誌へのリンクデータベースを整理した成果を基にして、非特許引用として収録された論文と学術論文データベースに収録された論文とをマッチングするアルゴリズムの開発を行った。 また、昨年度に引き続き、今後のアルゴリズムの改善に必要となる評価データの作成を実施した。年度当初の計画では、2000年から2009年に申請された米国特許の非特許引用1万件(各登録年につき1000件)をランダムサンプリングし、抽出された非特許引用と学術論文データベースに収録されたデータとのマッチングを研究補助者とともに手作業で実施する予定であったが(一部、機械作業併用)、評価の信頼性の確保およびアルゴリズムチューニング用のデータセットと評価用のデータセットとを分離することを念頭において、マッチングを行う非特許引用の件数を当初予定の倍の二万件(各登録年につき2000件)とした。データのマッチングは概ね完了しており、最終チェックを残すのみとなっている。 さらに、本研究の成果の活用先として重要な科学計量学を活用した評価について、理論的な検討を行い、論文として投稿した。なお、評価用データから直接得られる知見について論文を作成する計画であったが、マッチングの遅れにより24年度に並行して進めることとした。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
研究計画を若干変更し、評価等に活用するデータセットの規模を二倍にしたために、遅れが生じた。
|
Strategy for Future Research Activity |
当初予定した評価データのみを活用したプログラム開発から、チューニング用のデータと評価用データを分離することでパラメータ調整を行い、マッチング精度を高める。
|