研究課題/領域番号 |
17K05620
|
研究機関 | 国立研究開発法人産業技術総合研究所 |
研究代表者 |
森下 徹也 国立研究開発法人産業技術総合研究所, 材料・化学領域, 主任研究員 (10392672)
|
研究分担者 |
米澤 康滋 近畿大学, 先端技術総合研究所, 教授 (40248753)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 自由エネルギー / レアイベント / 位相空間 / 生体分子 / 分子動力学 |
研究実績の概要 |
30年度は、距離行列MDガイドの方法で得られたタンパク質構造変化情報(Ca間距離変化)を、深層学習方法の一つである自己組織化マップ法(Self Organizing Map: SOM)でクラスター解析し、機械学習による構造解析手法の有効性を検証した。 SOMは、データを数段階の階層的な層(例えばデータ層と学習層)にマッピングし、データ層の類似性を次の学習層に投影してデータ分類を自動的に達成する方法である。データはアデニレートカイネースを用いた距離行列MDガイド法で得られた。サイクルに依存したCa間距離変化の時系列データ(dij:214x214行列要素)を、SOM解析に用いた。この2次元dijをデータ層として、要素間の類似性を用いた標準的なSOMのプロトコルで、2次元の学習層(50x50)に投影した。学習する周辺領域は、近接するgrid領域として繰り返し毎に縮小し収束させた。このSOM結果から、ドメイン間の大振幅変化を示すCa間距離情報が明確にクラスター化されていることが判明し、MD計算結果の解析に際しSOMが有効であることが明らかになった。 また上記の機械学習による構造解析に加え、平均力ダイナミクスの代表手法であるTAMD(Temperature Accelerated MD)法やLogMFD法、さらに昨年度に本プロジェクトの研究成果として開発したLogPD法を実行できる計算プログラムコードを、一般公開を前提に開発した。本プロジェクトの計画通り、一般に公開し利用できるように31年度に整備する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
30年度は機械学習による蛋白質の構造解析をSOM法により実行し、その有効性を検証することができた。これは本プロジェクトの計画通りで、一般化CVの開発・構築と関連する重要な成果である。また、平均力ダイナミクスを実施するためのコード開発も順調に進み、一部は公開する段階まで進んでいる。従って、本研究は計画通り推進していると判断する。
|
今後の研究の推進方策 |
注目する動的変化を系に依らずに記述できるCVの、一般的な構築法の開発を推進する。30年度に検証したSOM法は、蛋白質構造情報のクラスター化に適用できることが判明し、構造の分類に威力を発揮することが明らかになった。一方、各クラスタの特徴を記述する量をCa間距離などの原子座標の関数として簡単に表現することは、必ずしも容易ではないことがわかった。そこで31年度は、蛋白質の瞬間構造と指標量が線形関数で結ばれている主成分解析を用いたCV構築や、エネルギーそのものをCVのようにみなし高エネルギー状態のサンプリングを向上させる方法を検討する。具体的には、30年度に試みたCa間距離をベースとした量を主成分解析することで、どのようなCVが構築できるか確認し、注目される大きな構造変化などが少数のCV変数で適切に記述できるか検証する。また、高エネルギー状態のサンプリングをバイアスポテンシャルの付加によりどの程度実現できるかも検証する。 検証には様々な量の解析計算を実施する必要があると予想されるため、比較的計算を高速に実行できるprotein-Gの粗視化モデル分子を計算対象とし、そのモデル分子の構造変化とエネルギー及びCV変数の関係を検証することで、様々なCV構築法の妥当性を検証する。 更に、30年度に開発した平均力ダイナミクスの実行を可能とするプログラムコードの公開を進める。具体的には、ヨーロッパで開発されている公開プログラムパッケージであるPLUMEDに組み込み、他のMD計算手法とも組み合わせた多種多様な利用を可能とするプラットフォームを提供する。一部機能はすでに利用可能であり、31年度はさらにPLUMEDコンソーシアムとの連携を強め、本プロジェクトによる開発コードの利用推進を強化する。
|
次年度使用額が生じた理由 |
研究代表者及び分担者がそれぞれ参加予定していた学会参加を、別の学会の主催事業や学内業務などの関係で断念せざる得なくなり、次年度への繰り越しが発生した。31年度はそれらの学会への参加が見込めるため、昨年度同様にこれら学会への参加旅費に使う予定である。
|