• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

大規模学術文献データのネットワーク構造を考慮した事前学習言語モデルに関する研究

Research Project

Project/Area Number 20K12076
Research InstitutionThe University of Tokyo

Principal Investigator

森 純一郎  東京大学, 大学院情報理工学系研究科, 准教授 (30508924)

Project Period (FY) 2020-04-01 – 2023-03-31
Keywords学術文献データ / 事前学習言語モデル / 引用ネットワーク / 表現学習
Outline of Annual Research Achievements

学術文献データの増加とそれに伴うデータのオープン化の背景の元、膨大な学術文献データから新発見や課題解決に繋がる多様な学術知を抽出することの重要性が認識されてきている。本研究では、大規模な学術文献データから有用な知識の抽出と発見を支援することを目的に、学術文献データのネットワーク構造を考慮 した大規模ハイパーテキストデータからの事前学習言語モデルの構築に関する基本的な方法論の研究を行う。
まず、COVID-19のパンデミックの発生以降において、その学術研究は急速に増加していた。そこで、関連する学術文献データセットに対 して引用ネットワーク解析を行い、COVID-19に関する科学的エビデンスや重要な技術などの情報を抽出した。その解析結果を広く一般に公開するとともに、これらの研究成果を複数の国際学会で発表した。
次に、 大規模学術文献データの文献間の引用関係に基づくハイパーテキストデータから事前学習言語モデルを構築する技術として、引用ネットワーク構造を考慮した文献テキストコーパスからの事前学習言語モデル構築のための予測問題の設計と実装に取り組んだ。また、事前学習言語モデルを用いて大規模な学術献データから有用な知識の抽出と発見を支援するための技術として、事前学習言語モデルにより獲得された分散表現を用いた引用ネットワークのリンク予測およびノード分類タスクによる評価に取り組んだ。これらの研究成果を自然言語処理分野のトップジャーナルの一つであるTACLを含め複数の論文誌および国際学会で発表した。
最後に、2022年度について、期間中に研究開発を行った手法を応用し、萌芽的な学術論文の発見、サーベイ論文の自動生成、研究トピックの抽出と時系列変化の可視化など、複数の新たなタスクに取り組んだ。これらの研究成果を複数の学会で発表し、その成果は学会での優秀論文受賞に至った。

  • Research Products

    (7 results)

All 2023 2022

All Journal Article (2 results) (of which Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (5 results)

  • [Journal Article] Classification of the Top-cited Literature by Fusing Linguistic and Citation Information with the Transformer Model2022

    • Author(s)
      Masanao Ochi, Masanori Shiro, Junichiro Mori, Ichiro Sakata
    • Journal Title

      Proceedings of the 18th International Conference on Web Information Systems and Technologies

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Predictive analysis of multiple future scientific impacts by embedding a heterogeneous network2022

    • Author(s)
      Ochi Masanao、Shiro Masanori、Mori Jun’ichiro、Sakata Ichiro
    • Journal Title

      PLOS ONE

      Volume: 17 Pages: -

    • DOI

      10.1371/journal.pone.0274253

    • Peer Reviewed / Open Access
  • [Presentation] 時系列構造化ニューラルトピックモデル2023

    • Author(s)
      宮本望, 磯沼大, 高瀬翔, 森純一郎, 坂田一郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] サーベイ論文自動生成に向けた大規模ベンチマークデータセットの構築2023

    • Author(s)
      笠西哲, 磯沼大, 森純一郎, 坂田一郎
    • Organizer
      言語処理学会第29回年次大会
  • [Presentation] Transformerモデルを用いた学術文献の言語情報と引用情報の融合2022

    • Author(s)
      大知正直、城真範、森純一郎、坂田一郎
    • Organizer
      2022年度人工知能学会全国大会
  • [Presentation] Self-attention機構に基づくDynamic Structured Neural Topic Model2022

    • Author(s)
      宮本望、磯沼大、森純一郎、坂田一郎
    • Organizer
      2022年度人工知能学会全国大会
  • [Presentation] Transformer Encoder-Decoderモデルによるサーベイ論文の自動生成2022

    • Author(s)
      笠西哲、磯沼大、森純一郎、坂田一郎
    • Organizer
      2022年度人工知能学会全国大会

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi