先行研究(調、2008)において作成した1995年から2005年に登録された米国特許内の非特許引用文献データからSCI内に収録された学術誌へのリンクデータベースを整理した成果を基にして、非特許引用として収録された論文と学術論文データベースに収録された論文とをマッチングするアルゴリズムの開発を行った。 また、昨年度に引き続き、今後のアルゴリズムの改善に必要となる評価データの作成を実施した。年度当初の計画では、2000年から2009年に申請された米国特許の非特許引用1万件(各登録年につき1000件)をランダムサンプリングし、抽出された非特許引用と学術論文データベースに収録されたデータとのマッチングを研究補助者とともに手作業で実施する予定であったが(一部、機械作業併用)、評価の信頼性の確保およびアルゴリズムチューニング用のデータセットと評価用のデータセットとを分離することを念頭において、マッチングを行う非特許引用の件数を当初予定の倍の二万件(各登録年につき2000件)とした。データのマッチングは概ね完了しており、最終チェックを残すのみとなっている。 さらに、本研究の成果の活用先として重要な科学計量学を活用した評価について、理論的な検討を行い、論文として投稿した。なお、評価用データから直接得られる知見について論文を作成する計画であったが、マッチングの遅れにより24年度に並行して進めることとした。
|