深層学習技術を用いた動的情報からの化合物ータンパク質結合親和性の抽出
Project/Area Number |
22K06112
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 43020:Structural biochemistry-related
|
Research Institution | Kyoto University |
Principal Investigator |
松本 篤幸 京都大学, 医学研究科, 特定准教授 (00753906)
|
Project Period (FY) |
2022-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2025: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2024: ¥2,080,000 (Direct Cost: ¥1,600,000、Indirect Cost: ¥480,000)
Fiscal Year 2023: ¥260,000 (Direct Cost: ¥200,000、Indirect Cost: ¥60,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 分子動力学計算 / 親和性予測 / 深層学習 / 結合親和性予測 / 低分子化合物 |
Outline of Research at the Start |
本研究ではタンパク質と低分子化合物の複合体立体構造に基づいてそれらの結合の強さを推定するためのAIモデルの構築を目的としている。結合の強さは分子の溶液中の動的振る舞いによって規定されている。しかしそれらの関係性を人間が厳密に記述することは困難である。そこでタンパク質―化合物の結合親和性と分子動力学計算によって得たそれらの複合体の動的情報との間を深層学習技術によって橋渡しするAIモデルを構築する。さらに発展的な取り組みとして、構築したAIモデルを利用して親和性情報のみを手掛かりに複合体立体構造を推定する。
|
Outline of Annual Research Achievements |
令和4年度は親和性予測のための深層学習モデル構築のための親和性情報の収集及び一部データについてMD計算による動的情報の生成を進めた。以下に詳細を示す。 1.データ準備として公共データベースBindingDBから、既に化合物との複合体立体構造と結合親和性の両方が決定されている例を抽出し、3,259種のタンパク質―化合物ペアを得た。さらに以下の手順で初期検討のための小規模データセット作成を行った; 1. リガンドsmilesが重複した例の除去 2. リン酸化Tyrなど修飾アミノ酸を持つタンパク質を除去, 3. 金属イオンが配位しているタンパク質を除去 4. 補酵素が結合しているタンパク質を除去。また今回のデータセット作成では簡便にMD計算を実施するため、1つのポリペプチド鎖で構成されているタンパク質を計算対象とした。このうち、入力情報がバラエティに富むようにmMからnMの範囲の親和性を持つタンパク質―化合物情報を偏りのないように手動で抽出し、32種のタンパク質―化合物ペアを小規模学習データセットとして得た。令和5年度以降のデータセット拡大では上記手順で除外したタンパク質―化合物ペアから適切な計算対象を再度選抜することにする。 2.小規模学習データセットのすべてについて、MD入力ファイルの準備を行い、100ナノ秒の全原子MD計算を5つの独立した初速度で実施した。MDエンジンとしてGROMACSを用い、化合物の力場パラメータは量子化学計算プログラムGAMESSを利用して準備した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
令和4年度に実施予定にしていた公共データベースからの親和性情報の収集を完了した。また、ここから抽出した初期検討のための小規模データセットについて、MD計算による動的情報の収集を完了した。以上のことから、本研究は当初の研究計画通りに進展していると判断される。
|
Strategy for Future Research Activity |
1.得られた初期検討用のMD計算結果を深層学習モデルの入力データにするための前処理手法を確立する。立体構造情報の入力形式は当初予定していた3次元ボクセル形式に加えグラフ形式を検討する。 2.タンパク質―化合物複合体の立体構造情報が入力可能な深層学習モデルの構築を行い、予測に最適なパラメータ―探索に着手する。 3.動的情報収集のためのデータセットキュレーション及びMD simulationを引き続き実施する。
|
Report
(1 results)
Research Products
(1 results)