• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

巨大な異種混合グラフの深層表現学習による薬物関係抽出

研究課題

研究課題/領域番号 20K11962
研究機関豊田工業大学

研究代表者

三輪 誠  豊田工業大学, 工学(系)研究科(研究院), 教授 (00529646)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード薬物間相互作用 / DrugBank / 関係抽出 / 深層学習 / 知識グラフ / 表現学習 / BERT / グラフニューラルネットワーク
研究実績の概要

本研究では,薬物データベースを対象に,薬物に関する様々な異種の分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を目指して研究を進めた.研究そのものは当初の計画通り進んでいたものの、その成果発表のために、本年度は研究期間を延長し、昨年度までに得られた成果を論文にまとめ,発表した。
研究機関全体では、まず、薬物データベースをもとに,薬物の名前・説明文・カテゴリ・関係などの薬物固有の情報に加え,薬物と関連するタンパク質などの様々な種類の情報を含む異種混合グラフを作成し、薬物の説明文や化学式の情報も含めて、統合的に表現する表現学習を実現した。この結果、どの情報を除いても、性能の低下が見られ、すべての情報を有効に活用できていることがわかった。
また、薬物データベースの情報を文書からの薬物関係抽出に利用する手法について研究を進め、まず大規模事前学習モデルBERTを用いた文書抽出により従来よりも高い性能を達成できることがわかった。さらに外部情報の利用については、まず、個別の情報の利用とその複数モデルのアンサンブルを中心に進め、外部情報により性能向上が実現でき、F値85.04%と高い性能のモデルを実現できた。さらに、知識グラフから学習した表現を入力する文書と対応付けたものを入力として、文書からの情報抽出を行う単一の統一されたモデルを実現し、最終的に85.40%というF値を達成した。当初は80%以上を数値目標としていたが、研究機関全体を通して、その数値目標を大幅に上回ることができた。
さらに、開発の過程でその周辺技術となる固有表現抽出、文献情報の表現学習、データベースのエントリと固有表現の関連付けなどの技術について調査・研究を行った。特に、その技術を評価するために参加したn2c2 shared taskではTrack内で参加者中1位の性能を達成することができた.

  • 研究成果

    (11件)

すべて 2024 2023

すべて 雑誌論文 (2件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (9件) (うち国際学会 3件)

  • [雑誌論文] Large-scale neural biomedical entity linking with layer overwriting2023

    • 著者名/発表者名
      Tsujimura Tomoki、Miwa Makoto、Sasaki Yutaka
    • 雑誌名

      Journal of Biomedical Informatics

      巻: 143 ページ: 104433~104433

    • DOI

      10.1016/j.jbi.2023.104433

    • 査読あり / オープンアクセス
  • [雑誌論文] Contextualized medication event extraction with striding NER and multi-turn QA2023

    • 著者名/発表者名
      Tsujimura Tomoki、Yamada Koshi、Ida Ryuki、Miwa Makoto、Sasaki Yutaka
    • 雑誌名

      Journal of Biomedical Informatics

      巻: 144 ページ: 104416~104416

    • DOI

      10.1016/j.jbi.2023.104416

  • [学会発表] 固有表現抽出における大規模言語モデルのLoRAファインチューニングの学習設定の調査2024

    • 著者名/発表者名
      鬼頭泰清, 牧野晃平, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] 他文書の予測を知識グラフに蓄積・利用する文書単位関係抽出2024

    • 著者名/発表者名
      松原拓磨, 辻村有輝, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] CVAEによる複数データセットからの固有表現抽出2024

    • 著者名/発表者名
      大井拓, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] 文献グラフにおける多項関係の埋め込み2024

    • 著者名/発表者名
      井田龍希, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] 複数の形式・表現の質問を利用した多角的な関係抽出2024

    • 著者名/発表者名
      山田晃士, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] IDレベル関係抽出における不要な文の自動選択2024

    • 著者名/発表者名
      辻村有輝, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第30回年次大会(NLP2024)
  • [学会発表] Distantly Supervised Document-Level Biomedical Relation Extraction with Neighborhood Knowledge Graphs2023

    • 著者名/発表者名
      Takuma Matsubara, Makoto Miwa, Yutaka Sasaki
    • 学会等名
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • 国際学会
  • [学会発表] Biomedical Relation Extraction with Entity Type Markers and Relation-specific Question Answering2023

    • 著者名/発表者名
      Koshi Yamada, Makoto Miwa, Yutaka Sasaki
    • 学会等名
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • 国際学会
  • [学会発表] Biomedical Document Classification with Literature Graph Representations of Bibliographies and Entities2023

    • 著者名/発表者名
      Ryuki Ida, Makoto Miwa, Yutaka Sasaki
    • 学会等名
      The 22nd Workshop on Biomedical Natural Language Processing and BioNLP Shared Tasks
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi