2019 Fiscal Year Research-status Report
タンパク質界面の複雑ダイナミクスの解析:機械学習とMD計算に基づく新手法の開拓
Project/Area Number |
18K05025
|
Research Institution | The University of Tokyo |
Principal Investigator |
山下 雄史 東京大学, 先端科学技術研究センター, 特任准教授 (50615622)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | 古典力学 / 機械学習 / データベース / 分子動力学シミュレーション |
Outline of Annual Research Achievements |
計算機の発展にともなう近年の機械学習法の発展は目覚ましい。例えば、画像認識の能力は人間の精度を上回り、チェスや囲碁も人間のチャンピオンに勝つ人工知能が登場している。本研究では、こうした技術の分子科学への導入によって、タンパク質間に見られる重要なダイナミクス現象を解き明かしていくことを目指している。前年度は、基本的な機械学習プログラムとデータベースのプロトタイプを作り、実際に動かすところまで到達した。 今年度の前半では、引き続き2次元ハミルトン系ダイナミクスの学習データベースを用いて、カオス性予測に取り組んだ。昨年度から準備しているk近傍法やサポートベクトルマシンやランダムフォレスト法やニューラルネットワーク法をテストした。昨年度は、良くて8割程度であったが、今年度はデータベースの拡充・プログラムとはパラメータの工夫により9割程度の正答率まで上げることができるようになった。正答率はどの手法も同じくらいであったので、現時点ではデータベースがいかに充実しているかに依存しているように思われる。後半においては、NaイオンとClイオンの会合を予測するための機械学習を実施することを想定して、NaCl水溶液系におけるデータベースの構築に取り組んだ。実際に多数のMDシミュレーションから座標と結果を取り出しデータベースのプロトタイプとした。機械学習の効率が2次元モデル系の場合と比べて成功率が上がらなかったが、次元の問題が大きいと考えられる。直接、カーテシアン座標を使うのではなく、集団座標を使って簡略化していくことが有効な方法の1つであると考えられる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
前年度に準備したデータベースや機械学習プログラムのプロトタイプをさらに発展させることが今年度の目標であった。今年度の前半では、2次元ハミルトン系ダイナミクスのカオス性予測に取り組んだが、10%程度正答率を向上させることに成功している。k近傍法やサポートベクトルマシンやランダムフォレスト法やニューラルネットワーク法のハイパーパラメータ依存性を丁寧に調べた成果である。後半においては、NaイオンとClイオンの会合を予測するための機械学習を実施することを想定して、NaCl水溶液系におけるデータベースの構築に取り組んだ。実際に多数のMDシミュレーションから座標と結果を取り出しデータベースのプロトタイプとした。実際のプロトタイプ構築において、モデル系に比べて現実の分子系では座標が莫大になることが問題点として取り出すことができた。
|
Strategy for Future Research Activity |
前年度に準備したデータベースや機械学習プログラムのプロトタイプをさらに発展させることが今年度の目標であった。今年度は、2次元ハミルトン系ダイナミクスのカオス性予測に取り組み、90%くらいの正答率を出せるようになってきた。k近傍法やサポートベクトルマシンやランダムフォレスト法やニューラルネットワーク法のハイパーパラメータの調整ではこれ以上の向上は難しいので、データベースの拡充をおこなうことで正答率の改良を目指していく。 また、NaイオンとClイオンの会合を予測するための機械学習を実施することを想定して、NaCl水溶液系におけるデータベースの構築に取り組んだ。実際に多数のMDシミュレーションから座標と結果を取り出しデータベースのプロトタイプとした。実際のプロトタイプ構築において、モデル系に比べて現実の分子系では座標が莫大になることが問題点として取り出すことができた。適切な集団座標を導入するなどの工夫をして、現実の分子系においても機械学習の技術を応用できるようにしていく。
|
Causes of Carryover |
今年度は前年度の手法的発展に注力したため、追加資源があまり必要ではなかった。次年度に計算規模を拡大することを予定しており、そちらで使用する予定である。
|
Research Products
(9 results)