近年、学術文献の出版のペースや技術イノベーションの速度が加速しており、それらの最新の科学技術情報を用いて政策や戦略立案に関する意思決定を行うことが求められている。このような背景の元で、科学技術のロードマッピングやフォーサイト・ホライゾンスキャンニングのような意思決定支援のため、大規模な学術文献情報を分析するための技術やそのプラットフォーム開発に関する研究が、近年特に盛んに行われている。大規模学術文献情報のテキストとネットワークデータを融合して分析を行い、知識抽出を行うプラットフォームを開発した。 まず、現在の主要な学術文献データベースから文献情報を抽出する機能をモジュール化を実施した。また、上記モジュール化にあわせ、学術・産業技術俯瞰システムPubmedやScopusなどのデータセットへ対応を実施した。その上で、ネットワークの分散表現を用いて学術領域のトレンドを把握し、そのトレンドをもとに萌芽予測を行うことで従来の予測精度を上回ることを示した 。また、その手法がテキスト情報をもとに将来的に有望なキーワードの推定に有用に機能することを実証した。以上に加え、学術俯瞰の基礎技術として引用関係の時系列的な変化や、論文引用ネットワークの中で伝わる技術用語の特定などの、基礎技術の開発を実施した。ネットワーク表現学習による萌芽領域の特定技術は国際ジャーナルに投稿中である。これらの技術は将来的な科学技術のフォーサイトなどに有用に機能すると考えられる。
|