研究課題/領域番号 |
20K11962
|
研究機関 | 豊田工業大学 |
研究代表者 |
三輪 誠 豊田工業大学, 工学(系)研究科(研究院), 准教授 (00529646)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 薬物間相互作用 / DrugBank / 関係抽出 / 深層学習 / 畳み込みニューラルネットワーク / 表現学習 / BERT / グラフニューラルネットワーク |
研究実績の概要 |
本研究では,薬物データベースを対象に,薬物に関する分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を目指している.
本年度は,当初の計画であった,属性・関係の包括的な利用のために,薬物データベースをもとに,薬物の名前・説明文・カテゴリ・関係,また,薬物と関連するタンパク質などの様々な種類の情報を含む異種混合グラフを作成し,そのグラフを対象にそれぞれの要素を表現し,既存の知識グラフ表現モデルの評価を行った.結果として,テキスト情報がすべての属性について言及しているわけではないため,必ずしもすべての種類の情報についてテキスト情報が重要とは言えないものの,テキスト情報を入れない場合と比べて,予測性能を大きく向上させることができる属性があることを確認した.
また,もともとはデータベース上の様々な情報を対象に評価を行う計画であったが,大規模データを利用した巨大なモデルであるBERTが広く使われ始めており,本課題についても同モデルを利用した評価を早めに実施しておくことが重要であると考え,言語表現の関係抽出での評価を優先して実施することとした.BERTを利用した薬物間相互作用抽出への利用の評価を行い,BERTを用いることで従来の薬物関係情報抽出の性能を大幅に向上できることを確認した.さらに薬物の説明文や化学式の情報を個別に利用することで,さらなる性能の向上を確認し,異種混合グラフの情報を用いなくとも,データベースの複数情報を利用することで,研究計画書の目標数値であったF値80%を超える84.4%を達成できることが分かり,さらなる高い抽出性能を達成できる可能性があることが分かった.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
異種混合グラフを用いた評価を行っており,個別の要素だけでなく,それらの対応付けを行う深層表現学習モデルの基盤まで作成することができており,さらなる情報を考慮することができるようになっており,この面については当初の計画以上に進展している.一方で,当初予定していた化学式や数値情報の表現に関する検討は十分にはできておらず来年度に検討する必要がある.
また,早倒しで実施した情報抽出モデルの改善により,当初の計画とは異なる方法ではあるものの,数値目標としては従来性能を10%以上大幅に上回る,研究計画書の数値を超える性能を達成している.本研究計画の対象としている異種混合グラフを用いた表現はこの性能改善と両立するものであるため,さらなる性能の向上を目指すことが可能である.
|
今後の研究の推進方策 |
令和3年度は,当初の計画の中で検討が十分にできていない化学式や数値情報の表現について検討するとともに,異種混合グラフを利用するモデルについてより有効な手法の利用について検討する.余裕があれば薬物相互作用抽出での評価を行う.
また,当初の計画にはなかったものの,異種混合グラフに出てくる関係のひとつである薬物タンパク質間相互作用などについても,データベース・関係抽出の側面から研究を行い,薬物の様々な側面についてより広く扱うことのできる方法についても検討を進める予定である.
|
次年度使用額が生じた理由 |
コロナ禍により,当初予定していた国内・海外出張ができなくなり,出張予定を延期したため,次年度使用額が生じた. 状況の改善に応じて,海外出張を考慮し,海外の研究グループとの交流を図る.状況が改善しない場合は,ジャーナルへの投稿への切り替えによる国際会議発表以外での場でのプレゼンスの向上や参加する研究者や学生への謝金・より強力な計算機の購入など研究の促進を図る.
|