2018 Fiscal Year Annual Research Report
In silico molecular design by means of deep learning and molecular simulation
Publicly Offered Research
Project Area | Frontier research of chemical communications |
Project/Area Number |
18H04636
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
齋藤 大明 国立研究開発法人理化学研究所, 生命機能科学研究センター, 研究員 (40506820)
|
Project Period (FY) |
2018-04-01 – 2020-03-31
|
Keywords | 分子動力学法 / 分子ドッキング / 機械学習 / タンパク質 |
Outline of Annual Research Achievements |
大規模実験データベースと分子シミュレーション,そして機械学習法の手法の連帯・最適化により薬物の活性・結合・親和性の予測精度を革新する計算モデルを開発する。これらは創薬開発プロセスにおける「薬物スクリーニング」や「薬物設計」のための最重要課題である。これら課題達成のため,Ⅰ.高精度なリガンド-タンパク質の構造データの作成や整備と,これを学習するためのⅡ.深層学習モデルの開発を行う。機械学習モデルは,画像認識等の分野において革新的な精度向上が達成されている多層ニューラルネットワークを用いた深層学習モデルを化合物の活性や結合予測に応用する。さらに作成した構造データや学習モデルの詳細な解析からⅢ.新たな物理化学概念/記述子を創出する。開発した予測モデルを用いて,具体的な標的タンパク質に対する化合物のスクリーニングや分子設計に関する応用研究を実施し,予測モデルの評価・改善・最適化を図る。具体的には(1)結合ポーズ,(2)活性・不活性を予測するモデルを開発する。また(3)結合親和性を予測するモデルを作成し,さらに,作成した構造データや深層学習モデルの詳細な解析を行うことにより(4)新たな物理化学概念/記述子を創出する。各々の研究項目毎に最適な学習データセットと深層学習モデルを構築し,評価データセットを用いてモデルの評価・検討を行う。開発した(1)-(3)の予測モデルは,具体的な標的タンパク質に対する化合物のスクリーニングや分子設計に関する応用研究に活用し,計算モデルの評価・改善・最適化を図る。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
学習用の構造データベースやドッキング計算用プログラムの調査はモデルの予測精度に大きく影響するため、これらの調査を慎重に行っている。また、データベース化合物の数は膨大であり、これによりデータ整備の進度が遅れている現状である。
|
Strategy for Future Research Activity |
タンパク質の3次元構造を学習する深層学習モデルのための計算プログラムの開発を行い、予測モデルの評価・検証を行う。
|