Project/Area Number |
22K17993
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 62010:Life, health and medical informatics-related
|
Research Institution | Tokyo Medical and Dental University |
Principal Investigator |
林 周斗 東京医科歯科大学, 難治疾患研究所, 准教授 (30902332)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2024: ¥650,000 (Direct Cost: ¥500,000、Indirect Cost: ¥150,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥2,860,000 (Direct Cost: ¥2,200,000、Indirect Cost: ¥660,000)
|
Keywords | 深層学習 / 分子動力学シミュレーション / タンパク質 / 機械学習 |
Outline of Research at the Start |
タンパク質が持つ機能を解析するため、分子動力学シミュレーションによりタンパク質立体構造のダイナミクスを解析する研究が広く行われている。しかしながら、分子動力学シミュレーションには大きな計算コストを必要とするという問題点があり、大規模・網羅的なシミュレーションを行うにはスーパーコンピュータを用いても膨大な時間を要する。そこで本研究では、深層学習をベースとしたデータ駆動型のアプローチを用いることで分子動力学シミュレーションを高速に行う手法を開発し、効率的な大規模・網羅的シミュレーションの実現を目指す。
|
Outline of Annual Research Achievements |
深層学習を用いた高速分子動力学シミュレーション手法の開発に関して以下の成果を得た。 1. 学習データセットの準備:前年度に取得したデータセットはヒトのタンパク質に限定されており、モデルの学習に用いるには不足していることが懸念されたため、追加の学習データを取得した。具体的には、AlphaFoldタンパク質構造データベース(Jumper et al., Nature, 2021; Varadi et al., Nucleic Acids Res, 2024)に登録されている16生物種、36,555種類のタンパク質に対して分子動力学シミュレーションを実行し、これらのタンパク質のトラジェクトリデータを取得した。また、より正確なトラジェクトリデータが得られるよう、ヒスチジン残基のプロトン化状態や、システイン間のジスルフィド結合に関する基準を見直した。 2. 深層ニューラルネットワークの改良:前年度に開発した深層ニューラルネットワークを基に、タンパク質情報をより詳細に表現できるようにアーキテクチャを改良した。具体的には、グラフニューラルネットワークのノード特徴量としてタンパク質構成原子の原子タイプの情報を、エッジ特徴量として原子間結合タイプの情報を、前年度までのモデルよりも詳細に考慮できるよう拡張した。これにより、これまでの精度を維持しつつ、より高速に分子動力学シミュレーションを模倣することができる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
学習データセットの取得、モデルの構築が完了し、学会発表も進んでいるため。
|
Strategy for Future Research Activity |
モデルの学習とベンチマークデータセットを使った検証を行うとともに、実データへの適用も進める。
|