本研究課題においては、科学技術政策研究において主要なトピックスの一つである科学と技術のリンケージを解析する際に活用される米国特許に引用された科学論文のデータベースの構築に向けて、米国特許に記載された引用文献と学術論文データベースに収録された文献との間のマッチングを実現すること、すなわちリンケージを同定するアクセシブルな手法の開発を目的として研究開発を実施してきた。さらに、その成果を研究者コミュニティにおいて共有することにより、科学技術イノベーション政策研究分野および実務の発展に貢献することを目的としてきた。 研究開発においては、具体的には曖昧さをある程度許容する形で項目毎のマッチングを行い、それら(筆頭著者姓、巻、最初のページ、発刊年、論文タイトル、掲載誌名(マッチングの厳密さに複数レベルを設定))のマッチングを組み合わせることで正確さを確保した個別アルゴリズムを作成し、さらに、これら個々のアルゴリズムではカバーできないリンケージの同定を教師データに対する学習に基づく複数の個別アルゴリズムの組み合わせで実現することに成功した。現段階において、マッチングの適切さは、precisionで99.5%、recallで91.8%と評価されており、当初の目標を達成した。 さらに、成果の共有を実現するために、当該成果の主要部分に関する論文を平成24年度内にISSI 2013投稿し、採択されたのでその手法を公表するとともに、上記の最終的な成果に結びつく改良を行った手法の詳細についてもSTI 2013に同年度中に論文にまとめ投稿した(2013年4月現在査読中)。今後、手法だけでなくリンケージデータの公開も公開する計画であり、そのための打ち合わせを関係機関の研究者と開始しており、データが公開された暁には研究分野および実務の発展に貢献出来る見通しである。
|