研究課題/領域番号 |
17K00427
|
研究機関 | 東京大学 |
研究代表者 |
森 純一郎 東京大学, 大学院情報理工学系研究科, 准教授 (30508924)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 学術文献データ / 引用ネットワーク / 表現学習 |
研究実績の概要 |
本研究では、大規模な学術文献情報からの有用な知識の抽出と発見を支援するために、論文データから生成される複数の異種ネットワークデータから分散表現を学習するための手法の研究を行う。これにより、大規模な論文データから生成される複数の異種ネットワークから適切な分散表現学習をする手法の知見を明らかにする。また、学習されたネットワーク分散表現を論文データ分析における複数のタスクに適用しその有効性を明らかにする。その上で、実際に大規模論文データ分析のシステム構築を行い、政策立案者、研究者、データベースプロバイダなど科学技術の複数のステークホルダの視点から、ネットワークデータを大規模な学術文献情報からの知識発見に利活用するための知見を明らかにする。 平成 30 年度はまず、異種ネットワーク分散表現を用いた論文や著者のクラスタリング手法の設計と実装を行った。 次に、異種ネットワーク分散表現を用いた論文や著者のインパクト予測手法の設計と実装を行った。具体的には、分散表現を用いた論文や著者のインパクト予測を行った。インパクトの指標としては論文の引用数や著者の H-Index などを用いて、それらを分散表現から予測を行った。 評価においては、提案者らが構築した評価用データセットを用いた定量的な加えて、 実際の予測結果を専門家に提示し、技術フォーサイト応用などの実用的な観点から評価を行った。評価タスクを通して、手法の改善を行った上で、提案者らが保有する「学術産業技術俯瞰システム」を活用し、手法を大規模な論文データ分析システムの機能として実装した上で、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対してサービス提供を行った。これらの研究成果は複数の国際学会やワークショップで発表した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
平成 30 年度はまず、異種ネットワーク分散表現を用いた論文や著者のクラスタリング手法の設計と実装を行った。 次に、異種ネットワーク分散表現を用いた論文や著者のインパクト予測手法の設計と実装を行った。具体的には、分散表現を用いた論文や著者のインパクト予測を行った。インパクトの指標としては論文の引用数や著者の H-Index などを用いて、それらを分散表現から予測を行った。 評価においては、提案者らが構築した評価用データセットを用いた定量的な加えて、 実際の予測結果を専門家に提示し、技術フォーサイト応用などの実用的な観点から評価を行った。評価タスクを通して、手法の改善を行った上で、提案者らが保有する「学術産業技術俯瞰システム」を活用し、手法を大規模な論文データ分析システムの機能として実装した上で、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対してサービス提供を行った。これらの研究成果は複数の国際学会やワークショップで発表した。
|
今後の研究の推進方策 |
平成 31年度は引き続き、分散表現を用いた論文や著者のインパクト予測タスクにおいて開発した手法の評価と改善を行う。 評価においては、提案者らが構築した評価用データセットを用いた定量的な加えて、 実際の予測結果を専門家に提示し、技術フォーサイト応用などの実用的な観点から評価を引き続き行う。評価タスクを通して、手法の改善を行った上で、提案者らが保有する「学術産業技術俯瞰システム」を活用し、手法を大規模な論文データ分析システムの機能として実装した上で、同システムを通して政策立案者、研究者、など科学技術の複数のステークホルダに対してさらに幅広いサービス提供を行う。これらの研究成果を複数の国際学会や論文誌へ投稿する。
|
次年度使用額が生じた理由 |
設備備品について、研究に用いるサーバを機関の従来設備で充当した。最終年度は研究成果の発表のため、国内学会と国際学会でのそれぞれ2回ずつ必要となる。また、謝金はシステムの構築および実証実験の補助を行う研究補助者1名に対して必要となる。
|