研究課題/領域番号 |
17K00427
|
研究機関 | 東京大学 |
研究代表者 |
森 純一郎 東京大学, 大学院情報理工学系研究科, 准教授 (30508924)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 学術文献データ / 引用ネットワーク / 表現学習 |
研究実績の概要 |
本研究では、大規模な学術文献情報からの有用な知識の抽出と発見を支援するために、論文データから生成される複数の異種ネットワークデータから分散表現を学習するための手法の研究を行う。これにより、大規模な論文データから生成される複数の異種ネットワークから適切な分散表現学習をする手法の知見を明らかにする。また、学習されたネットワーク分散表現を論文データ分析における複数のタスクに適用しその有効性を明らかにする。その上で、実際に大規模論文データ分析のシステム構築を行い、政策立案者、研究者、データベースプロバイダなど科学技術の複数のステークホルダの視点から、ネットワークデータを大規模な学術文献情報からの知識発見に利活用するための知見を明らかにする。 2019年度は引き続き、分散表現を用いた論文や著者のインパクト予測タスクにおいて開発した手法の評価と改善を行った。 評価においては、提案者らが構築した評価用データセットを用いた定量的な加えて、 現在は、開発した技術を用いて、対象分野の研究者の将来のH-Index、論文誌のImpact Factor、研究機関のNature Indexなどの指標について、実際の予測結果を専門家に提示し、技術フォーサイト応用などの実用的な観点から評価を引き続き行った。評価タスクを通して、手法の改善を行った上で、提案者らが保有する「学術産業技術俯瞰システム」を活用し、手法を大規模な論文データ分析システムの機能として実装した上で、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対してさらに幅広いサービス提供を行った。これらの研究成果を複数の国際学会で発表しまた論文誌へ投稿した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
2019年度は引き続き、分散表現を用いた論文や著者のインパクト予測タスクにおいて開発した手法の評価と改善を行った。 評価においては、提案者らが構築した評価用データセットを用いた定量的な加えて、 現在は、開発した技術を用いて、対象分野の研究者の将来のH-Index、論文誌のImpact Factor、研究機関のNature Indexなどの指標について、実際の予測結果を専門家に提示し、技術フォーサイト応用などの実用的な観点から評価を引き続き行った。評価タスクを通して、手法の改善を行った上で、提案者らが保有する「学術産業技術俯瞰システム」を活用し、手法を大規模な論文データ分析システムの機能として実装した上で、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対してさらに幅広いサービス提供を行った。これらの研究成果を複数の国際学会で発表しまた論文誌へ投稿するなど、研究は概ね順調に進んでいる。
|
今後の研究の推進方策 |
今後は本研究で研究開発を行った手法をさまざまな大規模な学術文献データに適用し手法の深化や評価を行う。特に、新型コロナウイルスの科学技術研究のためにアレン人工知能研究所(Allen Institue for AI)から公開された大規模な学術文献データセットに対して手法を適用する。同データセットは数万におよぶ新型コロナウイルス関連の学術文献のメタデータや本文情報を含み、現在数多くの研究グループがこれらの大規模学術文献データを分析して新型コロナウイルスに関する学術知を抽出し新たな発見をつながるような試みを進めている。提案者もこれまでの研究成果を元に同データセットの分析を行い、その結果を広く発信し活用してもらうように研究を推進する予定である。成果の発信にあたっては提案者らが保有する「学術産業技術俯瞰システム」を活用し、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対して情報提供を行う。これらの研究成果を引き続き複数の国際学会や論文誌へ投稿する。
|
次年度使用額が生じた理由 |
2019年度は異種ネットワーク分散表現を用いた論文や著者のインパクト予測手法の設計と実装を進めて研究成果を論文誌に投稿予定であったが、目的をより精緻に達成するの新たなデータセットが利用可能になり、それらのデータセットを用いた追加実験を行なった上で論文投稿を行うため補助事業期間を延長するものである。
|