研究課題/領域番号 |
22K17993
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62010:生命、健康および医療情報学関連
|
研究機関 | 東京医科歯科大学 |
研究代表者 |
林 周斗 東京医科歯科大学, 難治疾患研究所, 准教授 (30902332)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2024年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
|
キーワード | 深層学習 / 分子動力学シミュレーション / タンパク質 / 機械学習 |
研究開始時の研究の概要 |
タンパク質が持つ機能を解析するため、分子動力学シミュレーションによりタンパク質立体構造のダイナミクスを解析する研究が広く行われている。しかしながら、分子動力学シミュレーションには大きな計算コストを必要とするという問題点があり、大規模・網羅的なシミュレーションを行うにはスーパーコンピュータを用いても膨大な時間を要する。そこで本研究では、深層学習をベースとしたデータ駆動型のアプローチを用いることで分子動力学シミュレーションを高速に行う手法を開発し、効率的な大規模・網羅的シミュレーションの実現を目指す。
|
研究実績の概要 |
深層学習を用いた高速分子動力学シミュレーション手法の開発に関して以下の成果を得た。 1. 学習データセットの準備:前年度に取得したデータセットはヒトのタンパク質に限定されており、モデルの学習に用いるには不足していることが懸念されたため、追加の学習データを取得した。具体的には、AlphaFoldタンパク質構造データベース(Jumper et al., Nature, 2021; Varadi et al., Nucleic Acids Res, 2024)に登録されている16生物種、36,555種類のタンパク質に対して分子動力学シミュレーションを実行し、これらのタンパク質のトラジェクトリデータを取得した。また、より正確なトラジェクトリデータが得られるよう、ヒスチジン残基のプロトン化状態や、システイン間のジスルフィド結合に関する基準を見直した。 2. 深層ニューラルネットワークの改良:前年度に開発した深層ニューラルネットワークを基に、タンパク質情報をより詳細に表現できるようにアーキテクチャを改良した。具体的には、グラフニューラルネットワークのノード特徴量としてタンパク質構成原子の原子タイプの情報を、エッジ特徴量として原子間結合タイプの情報を、前年度までのモデルよりも詳細に考慮できるよう拡張した。これにより、これまでの精度を維持しつつ、より高速に分子動力学シミュレーションを模倣することができる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
学習データセットの取得、モデルの構築が完了し、学会発表も進んでいるため。
|
今後の研究の推進方策 |
モデルの学習とベンチマークデータセットを使った検証を行うとともに、実データへの適用も進める。
|