2021 Fiscal Year Research-status Report
タンパク質界面の複雑ダイナミクスの解析:機械学習とMD計算に基づく新手法の開拓
Project/Area Number |
18K05025
|
Research Institution | The University of Tokyo |
Principal Investigator |
山下 雄史 東京大学, 先端科学技術研究センター, 特任准教授 (50615622)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | 分子動力学 / 機械学習 / シミュレーション |
Outline of Annual Research Achievements |
機械学習技術の発展により、人工知能は画像認識やチェスや囲碁などの分野において人間の知能を凌駕するようになってきた。近年、AlphaFoldのような先進的なタンパク質構造予測技術においても、機械学習が中心的な役割を担っている。本研究では、こうした機械学習技術を分子科学に導入することによって、タンパク質間に見られる重要なダイナミクス現象を解き明かしていくことを目指している。 これまでの研究で、基本的な機械学習プログラムとデータベースのプロトタイプを作り、2次元ハミルトン系ダイナミクスの学習データベースを用いて、カオス性予測に取り組んだ。このテストにおいては9割程度の正答率まで上げることができるようになった。また、NaイオンとClイオンの会合・解離の予測をする機械学習にも取り組んできた。予測の正答率を75%程度まで向上することに成功している。 今年度は、機械学習モデルによるNaイオンとClイオンの会合・解離の予測精度が正答率これ以上改善することが困難になる要因について、解析をおこなった。機械学習手法・データ数・ハイパーパラメータなど色々な可能性を探ったが、本質的な正答率の改善はできなかった。そこで、系自体に、学習困難な要因がある可能性を調べた。その結果、不正解であった初期条件のトラジェクトリーはカオス性が高いものが多いことが分かった。さらに、タンパク質界面環境への応用として、卵白リゾチーム(HEL)とその抗体(HyHEL-10)の複合体にある塩橋の形成・崩壊のダイナミクスについてデータベース化をおこなった。さらに、簡略的な機械学習もおこなった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
NaイオンとClイオンの会合・解離の予測精度について解析をおこない、カオス性が高い領域の存在が計算精度の低下を引き起こしていることを見出した。現在、結果をまとめ、論文化を進めている。さらに、タンパク質界面環境への応用として、卵白リゾチーム(HEL)とその抗体(HyHEL-10)の複合体にある塩橋の形成・崩壊のダイナミクスについてデータベース化・簡略的な機械学習を実施した。
|
Strategy for Future Research Activity |
前年度までに構築したデータベースやプログラムを活用することにより、タンパク質界面における塩橋の会合・解離の機械学習をおこなう基本的なノウハウは目処がたった。今後は予測の正答率を上げる方法を考案していく。今の所、インプットできる自由度に限界があることが正答率を下げている原因だと考えている。そこで、自由度をあげて機械学習することを可能にするために、大型計算機を利用していく。また、機械学習で用いた特徴量の重要度についても見積もる方法を開発する。
|
Causes of Carryover |
新型コロナウイルス感染症の影響により、研究会がオンラインに変更されるなど旅費等が執行できなかった。今年度の人件費や旅費に割り当てることで、研究成果の発信を促進する。
|
Research Products
(4 results)