• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

巨大な異種混合グラフの深層表現学習による薬物関係抽出

Research Project

Project/Area Number 20K11962
Research InstitutionToyota Technological Institute

Principal Investigator

三輪 誠  豊田工業大学, 工学(系)研究科(研究院), 教授 (00529646)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords薬物間相互作用 / DrugBank / 関係抽出 / 深層学習 / 知識グラフ / 表現学習 / BERT / グラフニューラルネットワーク
Outline of Annual Research Achievements

本研究では,薬物データベースを対象に,薬物に関する様々な異種の分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を目指して研究を進めた.研究そのものは当初の計画通り進んでいたものの、その成果発表のために、本年度は研究期間を延長し、昨年度までに得られた成果を論文にまとめ,発表した。
研究機関全体では、まず、薬物データベースをもとに,薬物の名前・説明文・カテゴリ・関係などの薬物固有の情報に加え,薬物と関連するタンパク質などの様々な種類の情報を含む異種混合グラフを作成し、薬物の説明文や化学式の情報も含めて、統合的に表現する表現学習を実現した。この結果、どの情報を除いても、性能の低下が見られ、すべての情報を有効に活用できていることがわかった。
また、薬物データベースの情報を文書からの薬物関係抽出に利用する手法について研究を進め、まず大規模事前学習モデルBERTを用いた文書抽出により従来よりも高い性能を達成できることがわかった。さらに外部情報の利用については、まず、個別の情報の利用とその複数モデルのアンサンブルを中心に進め、外部情報により性能向上が実現でき、F値85.04%と高い性能のモデルを実現できた。さらに、知識グラフから学習した表現を入力する文書と対応付けたものを入力として、文書からの情報抽出を行う単一の統一されたモデルを実現し、最終的に85.40%というF値を達成した。当初は80%以上を数値目標としていたが、研究機関全体を通して、その数値目標を大幅に上回ることができた。
さらに、開発の過程でその周辺技術となる固有表現抽出、文献情報の表現学習、データベースのエントリと固有表現の関連付けなどの技術について調査・研究を行った。特に、その技術を評価するために参加したn2c2 shared taskではTrack内で参加者中1位の性能を達成することができた.

  • Research Products

    (11 results)

All 2024 2023

All Journal Article (2 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (9 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] Large-scale neural biomedical entity linking with layer overwriting2023

    • Author(s)
      Tsujimura Tomoki、Miwa Makoto、Sasaki Yutaka
    • Journal Title

      Journal of Biomedical Informatics

      Volume: 143 Pages: 104433~104433

    • DOI

      10.1016/j.jbi.2023.104433

    • Peer Reviewed / Open Access
  • [Journal Article] Contextualized medication event extraction with striding NER and multi-turn QA2023

    • Author(s)
      Tsujimura Tomoki、Yamada Koshi、Ida Ryuki、Miwa Makoto、Sasaki Yutaka
    • Journal Title

      Journal of Biomedical Informatics

      Volume: 144 Pages: 104416~104416

    • DOI

      10.1016/j.jbi.2023.104416

  • [Presentation] 固有表現抽出における大規模言語モデルのLoRAファインチューニングの学習設定の調査2024

    • Author(s)
      鬼頭泰清, 牧野晃平, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] 他文書の予測を知識グラフに蓄積・利用する文書単位関係抽出2024

    • Author(s)
      松原拓磨, 辻村有輝, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] CVAEによる複数データセットからの固有表現抽出2024

    • Author(s)
      大井拓, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] 文献グラフにおける多項関係の埋め込み2024

    • Author(s)
      井田龍希, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] 複数の形式・表現の質問を利用した多角的な関係抽出2024

    • Author(s)
      山田晃士, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] IDレベル関係抽出における不要な文の自動選択2024

    • Author(s)
      辻村有輝, 三輪誠, 佐々木裕
    • Organizer
      言語処理学会第30回年次大会(NLP2024)
  • [Presentation] Distantly Supervised Document-Level Biomedical Relation Extraction with Neighborhood Knowledge Graphs2023

    • Author(s)
      Takuma Matsubara, Makoto Miwa, Yutaka Sasaki
    • Organizer
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • Int'l Joint Research
  • [Presentation] Biomedical Relation Extraction with Entity Type Markers and Relation-specific Question Answering2023

    • Author(s)
      Koshi Yamada, Makoto Miwa, Yutaka Sasaki
    • Organizer
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • Int'l Joint Research
  • [Presentation] Biomedical Document Classification with Literature Graph Representations of Bibliographies and Entities2023

    • Author(s)
      Ryuki Ida, Makoto Miwa, Yutaka Sasaki
    • Organizer
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi