2023 Fiscal Year Research-status Report
Development of a fast molecular dynamics simulation method using deep learning
Project/Area Number |
22K17993
|
Research Institution | Tokyo Medical and Dental University |
Principal Investigator |
林 周斗 東京医科歯科大学, 難治疾患研究所, 准教授 (30902332)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Keywords | 深層学習 / 分子動力学シミュレーション / タンパク質 / 機械学習 |
Outline of Annual Research Achievements |
深層学習を用いた高速分子動力学シミュレーション手法の開発に関して以下の成果を得た。 1. 学習データセットの準備:前年度に取得したデータセットはヒトのタンパク質に限定されており、モデルの学習に用いるには不足していることが懸念されたため、追加の学習データを取得した。具体的には、AlphaFoldタンパク質構造データベース(Jumper et al., Nature, 2021; Varadi et al., Nucleic Acids Res, 2024)に登録されている16生物種、36,555種類のタンパク質に対して分子動力学シミュレーションを実行し、これらのタンパク質のトラジェクトリデータを取得した。また、より正確なトラジェクトリデータが得られるよう、ヒスチジン残基のプロトン化状態や、システイン間のジスルフィド結合に関する基準を見直した。 2. 深層ニューラルネットワークの改良:前年度に開発した深層ニューラルネットワークを基に、タンパク質情報をより詳細に表現できるようにアーキテクチャを改良した。具体的には、グラフニューラルネットワークのノード特徴量としてタンパク質構成原子の原子タイプの情報を、エッジ特徴量として原子間結合タイプの情報を、前年度までのモデルよりも詳細に考慮できるよう拡張した。これにより、これまでの精度を維持しつつ、より高速に分子動力学シミュレーションを模倣することができる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学習データセットの取得、モデルの構築が完了し、学会発表も進んでいるため。
|
Strategy for Future Research Activity |
モデルの学習とベンチマークデータセットを使った検証を行うとともに、実データへの適用も進める。
|
Causes of Carryover |
データセットの取得、および深層学習モデルの検証が想定以上にスムーズに進んだため、計算にかかるコストが予定を下回った。繰越分はモデルの学習に必要なスーパーコンピュータ使用料に充てる。
|