研究課題/領域番号 |
22K06112
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43020:構造生物化学関連
|
研究機関 | 京都大学 |
研究代表者 |
松本 篤幸 京都大学, 医学研究科, 特定准教授 (00753906)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 2,080千円 (直接経費: 1,600千円、間接経費: 480千円)
2023年度: 260千円 (直接経費: 200千円、間接経費: 60千円)
2022年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | 分子動力学計算 / 親和性予測 / 深層学習 / 結合親和性予測 / 低分子化合物 |
研究開始時の研究の概要 |
本研究ではタンパク質と低分子化合物の複合体立体構造に基づいてそれらの結合の強さを推定するためのAIモデルの構築を目的としている。結合の強さは分子の溶液中の動的振る舞いによって規定されている。しかしそれらの関係性を人間が厳密に記述することは困難である。そこでタンパク質―化合物の結合親和性と分子動力学計算によって得たそれらの複合体の動的情報との間を深層学習技術によって橋渡しするAIモデルを構築する。さらに発展的な取り組みとして、構築したAIモデルを利用して親和性情報のみを手掛かりに複合体立体構造を推定する。
|
研究実績の概要 |
令和4年度は親和性予測のための深層学習モデル構築のための親和性情報の収集及び一部データについてMD計算による動的情報の生成を進めた。以下に詳細を示す。 1.データ準備として公共データベースBindingDBから、既に化合物との複合体立体構造と結合親和性の両方が決定されている例を抽出し、3,259種のタンパク質―化合物ペアを得た。さらに以下の手順で初期検討のための小規模データセット作成を行った; 1. リガンドsmilesが重複した例の除去 2. リン酸化Tyrなど修飾アミノ酸を持つタンパク質を除去, 3. 金属イオンが配位しているタンパク質を除去 4. 補酵素が結合しているタンパク質を除去。また今回のデータセット作成では簡便にMD計算を実施するため、1つのポリペプチド鎖で構成されているタンパク質を計算対象とした。このうち、入力情報がバラエティに富むようにmMからnMの範囲の親和性を持つタンパク質―化合物情報を偏りのないように手動で抽出し、32種のタンパク質―化合物ペアを小規模学習データセットとして得た。令和5年度以降のデータセット拡大では上記手順で除外したタンパク質―化合物ペアから適切な計算対象を再度選抜することにする。 2.小規模学習データセットのすべてについて、MD入力ファイルの準備を行い、100ナノ秒の全原子MD計算を5つの独立した初速度で実施した。MDエンジンとしてGROMACSを用い、化合物の力場パラメータは量子化学計算プログラムGAMESSを利用して準備した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
令和4年度に実施予定にしていた公共データベースからの親和性情報の収集を完了した。また、ここから抽出した初期検討のための小規模データセットについて、MD計算による動的情報の収集を完了した。以上のことから、本研究は当初の研究計画通りに進展していると判断される。
|
今後の研究の推進方策 |
1.得られた初期検討用のMD計算結果を深層学習モデルの入力データにするための前処理手法を確立する。立体構造情報の入力形式は当初予定していた3次元ボクセル形式に加えグラフ形式を検討する。 2.タンパク質―化合物複合体の立体構造情報が入力可能な深層学習モデルの構築を行い、予測に最適なパラメータ―探索に着手する。 3.動的情報収集のためのデータセットキュレーション及びMD simulationを引き続き実施する。
|