2019 Fiscal Year Research-status Report
Collection of inter- and intramolecular interactions data and applications of database to drug discovery based on fragment molecular orbital method
Project/Area Number |
18K06619
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
高谷 大輔 国立研究開発法人理化学研究所, 生命機能科学研究センター, 研究員 (50571395)
|
Co-Investigator(Kenkyū-buntansha) |
渡邉 千鶴 国立研究開発法人理化学研究所, 生命機能科学研究センター, 研究員 (60549187)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | フラグメント分子軌道法 / データベース / 量子化学計算 / タンパク質-リガンド相互作用 / 機械学習 / 活性予測 / ドッキング |
Outline of Annual Research Achievements |
医薬品設計においてSBDDを実施する際、ターゲットタンパク質のタンパク質-リガンド間相互作用の評価が必要であり、量子化学計算の一つであるフラグメント分子軌道(Fragment Molecular Orbital; FMO)法による精密な相互作用エネルギー計算が有用である。前年度から引き続き主にPDBに登録されている立体構造を中心にFMO計算データ蓄積をおこなった。FMO法により計算されるフラグメント間相互作用エネルギーであるIFIE/PIEDAを記述子に含んだ阻害剤の予測モデル構築では、ChEMBL等で活性値が知られた阻害剤が多く含まれる複数のターゲットタンパク質とし、複数の機械学習手法を検討し性能を調査した。また近年ビッグデータを用いたAI構築等でFMO法により計算されるIFIE/PIEDAはタンパク質-リガンド間相互作用記述子として使用できる可能性があるため、計算済みのFMOデータはFMODB (https://drugdesign.riken.jp/FMODB/)に今後も登録していく予定である。また、FMODBでは一般の研究者に向けてインターネット経由でFMO計算済みデータにアクセスするためのWebインターフェースを提供している。そこで計算科学分野のIFIE/PIEDAの結果の解析に慣れているユーザーが必要なデータにアクセスするためのWebAPIを実装し、試験的に公開を始めた。今後も同分野の研究者から広く意見を募り、FMODBを有効活用するために必要な機能追加を検討していく。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
前年度から引き続きFMOデータの蓄積を行うとともに、創薬研究及び阻害剤設計に役に立つ予測モデル構築および予測性能等の検証を行った。FMODBのデータ蓄積については、タンパク質-リガンド分子複合体構造のFMO計算結果を継続して登録し増やした。基本的には幅広い種類のタンパク質構造の計算を行いつつ、活性値データ(IC50, Ki値等)とタンパク質-リガンド複合体構造データが対応付けられているPDBBind等の公知データを活用してFMO計算を行った。PDBBindのコアセット(約70ターゲット、216複合体構造)に対してFMO計算を試み110構造程度について計算が完了した。特にリガンド周辺で金属配位する部分構造持つ複合体は、現状のFMO計算の枠組みでは解析が難しく、それら以外の構造について優先して計算した。またFMO計算によって得られたリガンド対アミノ酸残基間のIFIE/PIEDAを主な記述子として未知の阻害剤との相互作用に対する予測モデル構築の予備検討を行った。hCHEK1, p38, Auroraキナーゼ等の多くのIC50, Ki値等の阻害活性値データが知られているターゲットに対してIFIE/PIEDAをベースとした予測モデル構築を試み、部分的最小2乗(PLS)法やランダムフォレスト(RF)法やサポートベクターマシーン(SVM)等の複数予測手法を試みた結果、RF 法の予測性能がよい傾向がわかった。またPIEDAからなる記述子を遺伝的アルゴリズム(NSGA-II)による絞り込みを行うことで、予測性能が向上することがわかった。結晶構造が少ない場合はドッキング計算等による学習データ数の増強や、MM-PBSA法等により溶媒効果を記述子に取り込むことで予測性能の改善によい影響を与える可能性があることが示唆された。
|
Strategy for Future Research Activity |
前年度から引き続きFMO計算データの蓄積を行う。PDBBindのリファインセット(約4,000複合体構造)の中から、FMO計算に適したターゲットを選定し、効率的にデータを得る。また活性値が知られているものの複合体構造が知られていない低分子に対してドッキング計算、及び予測複合体を用いたFMO計算を実施し学習データの量を増やすことで、公知の複合体構造が少ないターゲットタンパク質に対しても相互作用評価予測モデルを構築、得られたデータ及びFMO計算データ増加が予測性能に与える影響を検討する。 またIFIE/PIEDAを主な記述子として未知の阻害剤との相互作用に対する予測モデル構築の検討を引き続き行う。本研究で得られた一連のモデル構築のための構造作成手法の知見を、FMO計算自動化(Auto-FMO)プロトコルにフィードバックすることで、FMO計算の前処理を初期構造(X線、ドッキング構造等)に適したモデリングを行えるように必要に応じて改良する。前年度使用したキナーゼ類に加えその他のターゲットタンパク質についてもIFIEをベースとした予測モデル構築および性能検証を行うことで実施例を増やし、FMO法を用いた予測手法構築についての基盤情報を整備する。また必要に応じてWebAPIで扱えるデータの種類を増加させる。
|
Causes of Carryover |
論文投稿においては英文校閲費等、計算サーバーにまだディスク容量に十分な余裕があったため、バックアップ用記憶装置が不要になった事等が挙げられる。次年度バックアップ装置、英文校閲及び投稿費用、学会発表やリモートワーク対応等にその経費に充てることにしたい。
|