2021 Fiscal Year Research-status Report
Comprehensive prediction of cryptic binding sites by multi-task deep learning
Project/Area Number |
20K19917
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
柳澤 渓甫 東京工業大学, 情報理工学院, 助教 (40866646)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | リガンド結合部位予測 / 隠された結合部位 / マルチタスク深層学習 / 畳み込みニューラルネットワーク / 網羅的予測 / 共溶媒分子動力学法 |
Outline of Annual Research Achievements |
本研究は、タンパク質立体構造を入力とするマルチタスク深層学習を行い、低計算コスト・高精度の隠された (cryptic) 結合部位予測手法を開発し、生体内の分子間相互作用がまとめられたKEGG PATHWAYにマッピングすることで、薬剤標的タンパク質の選択に有用な情報を視覚的に提供するものである。 <現在までの進捗状況> 2021年度は【Step 2 マルチタスク学習の導入】を行なうことで予測精度の向上を実現した。タンパク質局所構造に対する深層距離学習を実施することで、タンパク質表面の構造変化に頑健な予測モデルを構築した。これにより、隠された結合部位予測の基本モデルの予測精度改善が確認された。また、【Step 3 MDシミュレーションとの統合】については顕著な進捗が得られている。2020年度に開発した手法が計算創薬のトップジャーナル Journal Chemical Information and Modeling誌に掲載された。また、共溶媒分子動力学法を用いて、タンパク質の構造変化に依存せずに、化合物部分構造が結合しやすいと期待されるタンパク質表面を同定することができることを見出した。この手法は査読付き国際論文誌に投稿中、2021年3月31日現在リバイズに対する論文の修正を行っている。 <2022年度の研究推進方策> 現在までの進捗状況を鑑み、2022年度は深層学習に基づく予測結果を、シミュレーション結果に基づいて補正する予測手法の開発と、既知タンパク質立体構造全件への網羅的手法適用を今年度の実施項目とする。2021年度に開発した共溶媒分子動力学法に基づく手法はそれ自体が隠された結合部位を推定する手法として活用可能であり、深層学習手法とは異なる視野から予測を行うことが期待される。このことから、この2つの手法を、既知タンパク質立体構造全件に対して網羅的に実施する。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
深層学習・MDシミュレーションの2つの側面からそれぞれ進捗が見られ、特にMDシミュレーションとの統合は顕著な成果が得られていることから、期待以上の成果が得られていると言える。 深層学習:マルチタスク学習を行う際の並行タスクとして、当初は17,000件以上のタンパク質-化合物結合立体構造がまとめられているscPDBを用いたマルチタスク学習を想定していた。しかし、タンパク質表面の構造変化を吸収し、構造変化に惑わされることなく隠された結合部位予測を行う予測モデルを構築する方が良いと判断し、タンパク質局所構造に対する距離学習 metric learning を実施した。これにより、隠された結合部位予測の基本モデルの予測精度改善および予測のロバスト性の獲得が確認されている。 MDシミュレーション:2020年度までに開発した、共溶媒分子動力学法(共溶媒MD、MSMD)を様々な共溶媒構造を用いて実施する手法が "EXPRORER: Rational Cosolvent Set Construction Method for Cosolvent Molecular Dynamics Using Large-Scale Computation" という題目で計算創薬のトップジャーナル Journal Chemical Information and Modeling誌に掲載された。また、このMSMDを用いることで、タンパク質の構造変化に依存せずに、化合物部分構造が結合しやすいと期待されるタンパク質表面を同定出来ることを見出した。この手法は第2の論文として、査読付き国際論文誌 International Journal of Molecular Science に投稿、2021年3月31日現在リバイズに対する論文の修正を行っている。
|
Strategy for Future Research Activity |
現在までの進捗状況を鑑み、2022年度はシミュレーション結果に基づいた予測補正によるロバストな手法の開発と、既知タンパク質立体構造全件への網羅的手法適用を今年度の実施項目とする。 <シミュレーション結果に基づく補正> シミュレーションに基づく化合物結合部位推定手法は、解析に用いる化合物部分構造が持つ疎水性・親水性などの性質ごとに異なる結果を示す。特に隠された結合部位予測には周辺残基の疎水性が関係することが知られていることから、この予測に適した化合物部分構造を少数選択し、それらの結果を統合、深層学習手法との併用を目指す。この深層学習手法との併用としては、(1) 機械学習による予測値とシミュレーションに基づく手法による予測値の統合、(2) シミュレーションに基づく手法で得られた値を機械学習に組み込む、という2通りが考えられるため、両者を比較検討する。 <既知タンパク質立体構造全件への網羅的手法適用> 隠された結合部位を標的とする薬剤は既存の薬剤標的部位とは大きく異なり、アロステリックな効果を示すことが期待される。このことは、副作用の低減、新規薬剤候補の発見につながるため、承認済み薬剤が存在しない薬剤標的タンパク質のみならず、既に承認済み薬剤が存在する既知タンパク質に対して手法を適用することは価値がある。そこで、タンパク質立体構造データベース PDB に登録されている全タンパク質立体構造に対して本研究課題の成果となる予測手法を適用し、隠された結合部位を網羅的に探索する。この際、特に隠された結合部位であると推定されたタンパク質については分子動力学シミュレーションならびに共溶媒分子動力学シミュレーションを用いることで、タンパク質表面構造の大きな変化が発生しうるかどうかを推定し、本予測手法が適切な推定結果を提示しているかどうかを評価する。
|
Causes of Carryover |
2021年度はコロナ禍の影響が依然残っており、国内・国際出張費に余分が生じた。この余剰金については主に計算資源の確保に利用し、この結果としてシミュレーションに基づく手法の想定以上の進捗が得られている。しかし、現地開催に参加予定であった年度末の学会が急遽オンライン化したことから、国内出張費に余剰が発生し、次年度使用額が発生した。 本研究課題の進捗は計算量の大きいシミュレーション手法の活用によって生じているため、当初の想定である計算機利用費・出張費・論文掲載費(オープンアクセス費含む)に加え、追加の計算機利用費が必要である。
|