研究課題/領域番号 |
20K11962
|
研究機関 | 豊田工業大学 |
研究代表者 |
三輪 誠 豊田工業大学, 工学(系)研究科(研究院), 准教授 (00529646)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 薬物間相互作用 / DrugBank / 関係抽出 / 深層学習 / 知識グラフ / 表現学習 / BERT / グラフニューラルネットワーク |
研究実績の概要 |
本研究では,薬物データベースを対象に,薬物に関する分野知識を包括的に表現し,その表現を利用した分野知識を活用した薬物関係抽出を目指している. 本年度は,当初の計画であったそれぞれの属性情報の表現を対応付け,異種混合グラフを包括的に表現する深層表現学習モデルの構築を目指した.具体的には,昨年度から一部始めていた異種混合グラフ上での表現学習を行い,評価を行うことで,異種情報を使わない場合に比べて,精度の向上ができることを確認した.また,昨年度は評価のできなかった,数値情報や化学式の情報について,評価をおこなった.化学式を用いた場合には,説明文と同様,高い精度を達成できる場合があることを確認したが,数値情報については予測モデルに問題があったため,異種混合グラフには含めないことにした. また,昨年度と同様,言語上での関係抽出について,作成した異種混合グラフの情報の利用可能性について調査を行った.結果として,昨年度作成した説明文や化学式を用いない異種混合グラフから学習した表現を用いることで,昨年度構築した説明文や化学式の情報を個別に用いるモデルに匹敵する精度を達成できることがわかった.更に,昨年度構築した情報抽出モデルに,今年度構築した異種混合グラフの情報を利用したモデルを組み合わせたアンサンブルモデルでは,85.02%のF値を達成し,抽出精度のさらなる向上を行うことができることがわかった. さらに,BioCreative7という共通タスクに参加し,作成した異種情報グラフ,言語上での関係抽出モデルを薬物タンパク質間関係抽出に適用し,評価を行った.結果としては,抽出性能そのものはトップの性能から劣っていたものの,異種情報グラフを導入することで薬物タンパク質間関係抽出についても性能の向上ができることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の計画通り,異種混合グラフを対象にした表現学習の評価を行い,一貫した性能の向上は得られなかったものの,異種情報を用いることで用いない場合に比べて表現学習の精度が向上できており,順調に進展していると言える. また,昨年度にすでに当初の目標数値を上回る性能を達成しているが,今年度は説明文や化学式の情報を含まない異種混合グラフを用いて学習した表現を用いたモデルが,昨年度の説明文や化学式を用いたモデルに近い精度を達成しており,異種混合グラフを用いた情報抽出の有効性を示すことができている.さらに,昨年度作成したモデルとのアンサンブルを行うことで,更なる性能の向上を得られており,これは昨年度作成したモデルと今年度の異種混合グラフを用いたモデルが異なる関係を捉えている可能性があることを示唆しており,異種混合グラフの重要性を示すことができていると考えている.一方で,アンサンブルにより計算コストが増えている点,異種混合グラフに説明文や化学式の情報を含んでおらず,外部知識として用いている点については,更なる改善が必要である.
|
今後の研究の推進方策 |
令和4年度は,当初の計画通り,言語上での関係抽出に焦点をあて,説明文や化学式まで含んだ異種混合グラフを利用して学習を行った表現を言語上での関係抽出について適用し,異種混合グラフとしてすべての情報を統一的に扱うことのできるモデルに付いて検討を行う.これまでのモデルでは,異なる情報から作成したモデルをアンサンブルによって統合しており,一貫性のないモデル・表現になっている部分があるので,これを異種混合グラフの処理においてまとめた薬物に関する分野知識を包括的に表現し,利用するモデルを目指す.
|
次年度使用額が生じた理由 |
コロナ禍により,当初予定していた国内・海外出張ができなくなり,出張予定を延期したため,次年度使用額が生じた. 海外出張を考慮し,海外の研究グループとの交流を図る.また,ジャーナルへの投稿への切り替えによる国際会議発表以外での場でのプレゼンスの向上やより強力な計算機の購入など研究の促進を図る.
|