本研究では、大規模な学術文献情報からの有用な知識の抽出と発見を支援するために、論文データから生成される複数の異種ネットワークデータから分散表現を学習するための手法の研究を行う。これにより、大規模な論文データから生成される複数の異種ネットワークから適切な分散表現学習をする手法の知見を明らかにする。また、学習されたネットワーク分散表現を論文データ分析における複数のタスクに適用しその有効性を明らかにする。その上で、実際に大規模論文デー分析のシステム構築を行い、政策立案者、研究者、データベースプロバイダなど科学技術の複数のステークホルダの視点から、ネットワークデータを大規模な学術文献情報からの知識発見に利活用するための知見を明らかにする。 2020年度は引き続き、分散表現を用いた論文や著者のインパクト予測タスクにおいて開発した手法の評価と改善を行った。COVID-19のパンデミックの発生以降において、その学術研究は急速に増加しており、米国のAllen AI研究所ではそれらのCOVID-19に関連する学術文献データセットを公開しており、その数は2020年8月時点で20万を超える文献の書誌情報が含まれている。同データセットに対して学術産業技術俯瞰システムを用いて引用ネットワーク解析を行い、COVID-19に関する科学的エビデンスや重要な技術などの情報を抽出した。これにより、研究者のみならず技術者、政策決定者などさまざまなステークホルダーに対して、COVID-19に対するエビデンスベースの取り組みを支援するため、その解析結果を広く一般に公開した。これらの研究成果を複数の国際学会で発表しまた論文誌へ投稿した。
|