• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

巨大な異種混合グラフの深層表現学習による薬物関係抽出

研究課題

研究課題/領域番号 20K11962
研究機関豊田工業大学

研究代表者

三輪 誠  豊田工業大学, 工学(系)研究科(研究院), 准教授 (00529646)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード薬物間相互作用 / DrugBank / 関係抽出 / 深層学習 / 知識グラフ / 表現学習 / BERT / グラフニューラルネットワーク
研究実績の概要

本研究では,薬物データベースを対象に,薬物に関する分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を目指している.
本年度は,昨年度作成した異種混合グラフを包括的に表現する深層学習により得られた表現を,当初の目的であった薬物関係抽出へ適用し,その性能の向上ができることを示した.昨年度までは,表現に利用した情報が化学式や説明文の情報を含んだものになっておらず限定的であり,また,それぞれの情報を個別に追加した薬物関係抽出手法のアンサンブルモデルを構築する事で様々な情報を利用した性能向上を達成しており,分野知識を包括的に表現して,利用するという目標には至っていなかった.本年度は化学式や説明文の情報を含めた,包括的な表現を作成し,その表現を薬物関係抽出手法に利用することでモデルを複数作成せずとも様々な分野知識を活用し,性能の向上が得られることを確認し,結果として85.40%のF値を単一のモデルで達成した.さらに,個別の情報を削除する事で性能の低下も確認し,それぞれの知識がモデルの性能向上に寄与していることも明らかにした.
さらに,文書から関係を抽出する際に必要な文書中で薬物を表す固有表現の抽出,文献情報の表現学習,データベースのエントリと固有表現の対応付け・リンキング,薬物に近いタンパク質や遺伝子など他のエンティティとの関係への利用など,研究を実際の文書に利用する際に必要な手法について調査・研究を行った.特に,固有表現抽出の技術を評価するために,参加したn2c2 shared taskではTrack内で参加者中1位の性能を達成することができた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

当初の計画通り,異種混合グラフを対象にした表現学習を行い,それを利用して薬物関係抽出の性能向上を達成することができた.昨年度の課題であったアンサンブルによる計算コストの増加や限定的な外部情報の利用という問題を解決し,一つのモデルを対象に,異種情報の種類を増やすほど性能が向上する一貫性のあるモデルを実現でき,結果として従来モデルを上回る性能を達成しており,順調に進展したと言える.

今後の研究の推進方策

本研究課題での薬物に関する分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を実現するという目標については,達成できており,結果も良い結果が得られている.しかし,利用できていない外部情報の利用,文書情報の分野知識への利用や文書内の薬物への言及の抽出,文書内の薬物とデータベースの対応付など様々な部分について十分な研究ができていない部分が残っており,今後の研究を通じて,更なる発展を目指す予定である.また,成果の対外発信のために,期間の延長を行なっており,成果を発信していく予定である.

次年度使用額が生じた理由

これまで得られた結果について,一部未発表の内容があるため,追加実験を行い,学会参加,論文投稿を行う.

  • 研究成果

    (9件)

すべて 2023 2022

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 1件) 学会発表 (7件) (うち国際学会 2件)

  • [雑誌論文] Integrating heterogeneous knowledge graphs into drug?drug interaction extraction from the literature2022

    • 著者名/発表者名
      Asada Masaki、Miwa Makoto、Sasaki Yutaka
    • 雑誌名

      Bioinformatics

      巻: 39 ページ: -

    • DOI

      10.1093/bioinformatics/btac754

    • 査読あり / オープンアクセス
  • [雑誌論文] Improving Supervised Drug-Protein Relation Extraction with Distantly Supervised Models2022

    • 著者名/発表者名
      Iinuma Naoki、Miwa Makoto、Sasaki Yutaka
    • 雑誌名

      Proceedings of the 21st Workshop on Biomedical Language Processing

      巻: - ページ: 161-170

    • DOI

      10.18653/v1/2022.bionlp-1.16

    • 査読あり
  • [学会発表] テキスト情報の表現を利用した文献グラフの表現学習2023

    • 著者名/発表者名
      片桐脩那, 井田龍希, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] 近傍知識グラフからの埋め込みを統合利用する文書からの遠距離教師あり関係抽出2023

    • 著者名/発表者名
      松原拓磨, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] ラベル内容のエンコードとラベル間の制約に基づく補助コーパスを用いた固有表現抽出2023

    • 著者名/発表者名
      大井拓, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] 文書外の書誌情報と用語情報を組み込んだ文書分類2023

    • 著者名/発表者名
      井田龍希, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] 複数の質問形式を利用した分類型の質問応答による薬物タンパク質間関係抽出2023

    • 著者名/発表者名
      山田晃士, 三輪誠, 佐々木裕
    • 学会等名
      言語処理学会第29回年次大会
  • [学会発表] Span-based and Question Answering-based Medication Event Extraction2022

    • 著者名/発表者名
      Koshi Yamada, Ryuki Ida, Tomoki Tsujimura, Kohei Makino, Makoto Miwa and Yutaka Sasaki
    • 学会等名
      2022 n2c2/OHNLP Shared Task and Workshop
    • 国際学会
  • [学会発表] Improving Supervised Drug-Protein Relation Extraction with Distantly Supervised Models2022

    • 著者名/発表者名
      Iinuma Naoki、Miwa Makoto、Sasaki Yutaka
    • 学会等名
      Proceedings of the 21st Workshop on Biomedical Language Processing
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi