研究の目的である,文献からの薬物関係 (薬物間相互作用) 抽出への薬物データベースの有効利用のために,薬物データベースDrugBank上に記載されている薬物間の関係情報を表現する方法について研究を行った. 当初の計画においては,用語のみを利用してその関係を表現することを考えていたが,薬物によっては関係情報が記載されておらず,表現を獲得できないことがわかったため,2018年度より薬物の付加情報も同時に利用する手法について研究を進めている. 2019年度は,2018年度に利用した用語以外の薬物の付加情報として,化学式と薬物それぞれの説明文について表現を獲得する手法についてより発展したモデルの利用を図るとともに,研究の最終目標である関係情報抽出のさらなる精度向上に向けて,言語を対象とした巨大な事前学習モデルBERTを利用する研究を行い,薬物関係抽出の精度の大幅な向上を達成した. 具体的には,化学式についてはグラフの部分グラフを用いた表現を昨年までのグラフニューラルネットワークに追加した.説明文と関係抽出そのものについてはBERTを,昨年までの畳み込みニューラルネットワークに追加した.これにより,関係情報が記載されていない薬物に関しても,その記述文からその薬物の表現を獲得し,その薬物と他の薬物の関係をデータベース上で表現することが出来る基盤を確立した.この化学式,説明文いずれを用いた手法においても,その表現が上記の関係情報抽出システムを改善できることを示し,さらにBERTを利用することで,当初計画の目標であった70%の精度を大幅に超える80%以上の精度を達成した.
|