2021 Fiscal Year Research-status Report
A Construction of Drug Design Theory based on the Hydration of Proteins
Project/Area Number |
21K06107
|
Research Institution | Tohoku University |
Principal Investigator |
吉留 崇 東北大学, 工学研究科, 助教 (90456830)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | 水和 / 深層学習 / 溶液理論 / タンパク質 / リガンド |
Outline of Annual Research Achievements |
既存のリガンド結合予測法では無視されていた「水和」を顕に考慮することで、リガンド結合予測精度を向上させることを目指し、以下の研究を行った。(1)本研究課題の武器である「水和分布を予測する深層学習モデル」について、論文をほぼ完成させた。また、これに伴い、深層学習モデルをGitHubで公開することにし、その準備を整えた。(2)「水和分布を予測する深層学習モデル」の精度が悪い箇所を特定し、その箇所の精度を改善するように学習データを増やすことにより、深層学習モデルの精度を向上させることに成功した。(3)「水和分布を予測する深層学習モデル」を発展させ、水和熱力学量を高速で計算する深層学習モデルの研究に取り組んだ。水和自由エネルギーに関し、R2スコアが0.8程度の精度予測することに成功した。(4)単純流体モデルを用いて、分子性流体用積分方程式理論で得られる水和エントロピーを定量的に再現することに成功した(論文投稿中)。(5)単純流体の積分方程式理論と3D-RISM理論を用いて、 エネルギー表示法で得られた水和自由エネルギーの値(T. Yoshidome, T. Ekimoto, N. Matubayasi, Y. Harano, M. Kinoshita, and M. Ikeguchi, J. Chem. Phys., 142, 175101 (2015).)を定量的に再現する手法を開発した。(6)深層学習を用いてタンパク質立体構造を予測するAlphaFoldに関し、側鎖の精度を議論した。約500残基のタンパク質に対し、約20%の側鎖の2面角が大きくずれていることが分かった。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究課題の目的の達成に向け、アドミニストレーティブアシスタントとして雇用した大学院生のサポートを受けながら、当初の計画通りほぼ順調に経過している。特に水和熱力学量を高速で計算する深層学習モデルを構築することができたことから、水和を顕に考慮したリガンド結合ポーズの同定法の開発に目処が立った。また、水和自由エネルギーと水和エントロピーを定量的に計算する手法が確立できたことから、研究課題の1つである「リガンド結合を支配する物理因子の解明」の準備が整った。さらに、「水和分布を予測する深層学習モデル」に関し、世界中の研究者に使ってもらうための公開の目処が立ったことは大きな成果である。しかし、その一方で「水和分布を予測する深層学習モデル」をリガンド結合に応用する研究については、モデルの高度化や水和熱力学量計算手法の研究に時間を取られたため、次年度に持ち越しとなった。リガンド結合に応用する準備は本年度でほぼ完了したので、来年度に速やかに研究を遂行する。
|
Strategy for Future Research Activity |
「水和分布を予測する深層学習モデル」をドッキングプログラムに統合し、「水和」を顕に考慮することで、リガンド結合予測プログラムを開発する。水和を考慮した場合と考慮しなかった場合で精度や計算時間などを議論する。また、開発した水和エントロピーと水和自由エネルギーを定量的に計算する手法をリガンド結合に応用し、リガンド結合を支配する物理因子を研究する。さらに、深層学習モデルの論文を投稿し、プログラムをGitHubで公開する。水和熱力学量を高速で計算する深層学習モデルについては、学習データ数を増やしたり水和分布を予測する深層学習モデルのパラメータを用いた転移学習を導入したりすることにより、モデルの精度向上を目指す。最後に、得られた成果を速やかに論文としてまとめる。
|