2018 Fiscal Year Research-status Report
3次元畳み込みニューラルネットワークによる構造ベース化合物活性予測
Project/Area Number |
18K11524
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
石田 貴士 東京工業大学, 情報理工学院, 准教授 (40508355)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 薬剤活性予測 / エンドツーエンド表現学習 / タンパク質ポケット構造 / グラフニューラルネットワーク |
Outline of Annual Research Achievements |
当該年度においてはまず新規の標的タンパク質への化合物の活性の予測に関して、タンパク質構造情報と低分子化合物の双方を機械学習モデルの入力とした場合に予測精度の向上が得られるのかをタンパク質の結合ポケットの構造情報をFuzCavフィンガープリントによりコード化することで確認した。Protein Data Bankに登録されているタンパク質―リガンド複合体構造を学習に使用し、MUVデータセットとChEMBLから作成したデータセットに対して予測を行なった結果、AutoDock Vinaを使用したドッキングシミュレーションと比較して、予測時間の短縮と、同等の予測精度を達成することを示した。 その後予測精度の向上を図るため、エンドツーエンド表現学習を取り入れることを試みた。タンパク質ポケット構造情報をアミノ酸残基をノードとし、距離情報をエッジとしたグラフとして捉え、グラフニューラルネットワークを適用したエンドツーエンド表現学習によって活性予測を行う手法を提案し、さらなる予測精度の向上が得られることを確認した。この手法はAutoDock Vinaを使用したドッキングシミュレーションに対してだけではなく、同様の目的で開発されたタンパク質の表現としてアミノ酸配列情報を用いる既存の手法に対しても精度の改善に成功しており、タンパク質構造情報が必要となるため適用範囲は狭くなるもの、用いている構造情報はかなり粗いものであるため、予測構造などを入力としても同様の結果が得られることが期待できると考えている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
先行研究でもある程度示されていたが、タンパク質構造情報を用いることで新規の標的タンパク質に対しても機械学習の手法が利用可能であることが明らかとなり、現在はどのようにタンパク質構造情報をディープニューラルネットワークに入力するかを中心として性能の向上に取り組んでおり、進捗状況は想定の範囲となっている。
|
Strategy for Future Research Activity |
関連手法で用いているタンパク質構造情報以外のアミノ酸配列情報などのタンパク質に関係する情報を取り込むことを試みる。また、現在はデータ数や訓練コストの関係で、タンパク質構造をグラフとして捉え、グラフニューラルネットワークにより表現学習を試みているが、当初の研究計画で想定していた3次元畳み込みニューラルネットワークについてもその利用についてのノウハウが蓄積しつつあり、今後はデータの追加を行い3次元畳み込みニューラルネットワークを用いた手法についても開発を行う予定である。
|
Causes of Carryover |
当初研究に必要となるワークステーションの購入を想定していたが、大学所有の大型計算機の利用がより本研究に適していることが判明し、ワークステーションの購入費用を複数年度の計算機利用料に振り分けることとしたため
|