研究課題/領域番号 |
22K06112
|
研究機関 | 京都大学 |
研究代表者 |
松本 篤幸 京都大学, 医学研究科, 特定准教授 (00753906)
|
研究期間 (年度) |
2022-04-01 – 2026-03-31
|
キーワード | 分子動力学計算 / 親和性予測 / 深層学習 |
研究実績の概要 |
令和4年度は親和性予測のための深層学習モデル構築のための親和性情報の収集及び一部データについてMD計算による動的情報の生成を進めた。以下に詳細を示す。 1.データ準備として公共データベースBindingDBから、既に化合物との複合体立体構造と結合親和性の両方が決定されている例を抽出し、3,259種のタンパク質―化合物ペアを得た。さらに以下の手順で初期検討のための小規模データセット作成を行った; 1. リガンドsmilesが重複した例の除去 2. リン酸化Tyrなど修飾アミノ酸を持つタンパク質を除去, 3. 金属イオンが配位しているタンパク質を除去 4. 補酵素が結合しているタンパク質を除去。また今回のデータセット作成では簡便にMD計算を実施するため、1つのポリペプチド鎖で構成されているタンパク質を計算対象とした。このうち、入力情報がバラエティに富むようにmMからnMの範囲の親和性を持つタンパク質―化合物情報を偏りのないように手動で抽出し、32種のタンパク質―化合物ペアを小規模学習データセットとして得た。令和5年度以降のデータセット拡大では上記手順で除外したタンパク質―化合物ペアから適切な計算対象を再度選抜することにする。 2.小規模学習データセットのすべてについて、MD入力ファイルの準備を行い、100ナノ秒の全原子MD計算を5つの独立した初速度で実施した。MDエンジンとしてGROMACSを用い、化合物の力場パラメータは量子化学計算プログラムGAMESSを利用して準備した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
令和4年度に実施予定にしていた公共データベースからの親和性情報の収集を完了した。また、ここから抽出した初期検討のための小規模データセットについて、MD計算による動的情報の収集を完了した。以上のことから、本研究は当初の研究計画通りに進展していると判断される。
|
今後の研究の推進方策 |
1.得られた初期検討用のMD計算結果を深層学習モデルの入力データにするための前処理手法を確立する。立体構造情報の入力形式は当初予定していた3次元ボクセル形式に加えグラフ形式を検討する。 2.タンパク質―化合物複合体の立体構造情報が入力可能な深層学習モデルの構築を行い、予測に最適なパラメータ―探索に着手する。 3.動的情報収集のためのデータセットキュレーション及びMD simulationを引き続き実施する。
|
次年度使用額が生じた理由 |
当初生成されるMDデータ保存のためのストレージを準備する予定であったが、令和4年度でのデータ作成では既に準備済みの計算環境内のストレージで対応できたため次年度使用額が生じた。 令和5年度は動的情報データセットをさらに拡大する。これを実施する中で大量のMDデータが生成されてくることが予想され、追加のストレージの購入費用として助成金を使用する。また、最先端の研究を進めていく上で必要不可欠な他の研究者との情報交換のための費用として使用する。以上の研究活動を通じて得られた成果を国内外の学会並びに学術雑誌等を通じて社会に発信するための費用として使用する。
|