2013 Fiscal Year Research-status Report
水和水が媒介するタンパク質リガンド相互作用をデータマイニングで解明する
Project/Area Number |
25650050
|
Research Category |
Grant-in-Aid for Challenging Exploratory Research
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
水上 卓 北陸先端科学技術大学院大学, マテリアルサイエンス研究科, 助教 (50270955)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | 分子動力学計算 / タンパク質 / ドッキング / 水和 / データマイニング / 特徴空間 / Lasso正則化 |
Research Abstract |
本研究の目標は,タンパク・リガンド結合系を対象に,データマイニング法により定義された水和水の様々な条件下での可視化(現象論)と,溶媒和自由エネルギー計算による水和効果の見積り(定量化)である.平成25年度は,以下の研究を行った. I.モデルタンパク質を用いたデータマイニング法の改良と拡張;データマイニングでは,特徴空間の設計がその結果の可否を決定する.1個の水の酸素原子の軌道(x[t],y[t],z[t])をある代表値をもつ時間幅で混合分布モデル(GMM)を適用し実空間分布を抽出した.この分布は,水分子の移動の「かたち」を特徴付けたものである.次に分布の形状や合成して数十次元の(数値)特徴空間を作成した.この操作を全水分子,全MD時間領域で行って数十万要素からなる特徴空間上のマッピングを得た.このマッピングに対して正規分布を与えるような変換(2次GMM変換)と主成分解析(PCA)を組み合わせて処理し,純水系と水+タンパク質系を比較することによって,水和水を特徴空間上の領域として定義しMD空間上で可視化することに成功した[1].さらに,Lasso正則化線形モデルによりGMM特徴空間の構造を解析し,物理パラメータ間の決定構造を推定した[2]. II.モデルタンパク質を用いたリガンド結合過程のMDとデータマイニング;タンパク質複合体としてBarstar-Barnaseをモデルに用い,ドッキング過程でデータマイニングによる水和水の変化が観測した.複合体の立体構造からそれぞれを分離し,距離をおいて配置した状態で長時間のMDをし,タンパク質間の距離をステップワイズに変化させて,Iで定義された水和水に及ぼす影響を検討した.その結果,距離が近づくにつれて水和サイトが増加することがわかった. テーマIは,1.ACCMS7,2.分子科学討論会にて,テーマIIは3.生物物理学会年会にて発表を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究では古典MDシミュレーションを行う必要があるが,申請者は既に十分経験を有しているため,データ生成に関しては当初の予定通り進んでいる.データマイニング解析においては,特徴空間の設計が成否のカギである.本課題解決には申請者のこれまでの研究の経験および,研究協力者のサポートを得て,生物学・物理学的観点やノウハウを活用する事によって,良好な写像を設計できた.そのため,データマイニングによる解析手法の開発は順調に進展している. 具体的には当初予定していた,I. データマイニング法の改良と拡張,II. モデルタンパクを用いたリガンド結合過程のMDとデータマイニング,を遂行した.得られた結果をそれぞれ,2つの国内学会,1つの国際学会において発表した.水和現象における物理パラメータ間の決定構造を推定のテーマについては当初予定が無かったが,発展的にアイデアを得て実行した研究である.本研究を遂行する上で派生的な成果が得られた.水和水についてのデータマイニング手法に関する論文を準備中である. 以上の点からおおむね順調に進展していると評価した.
|
Strategy for Future Research Activity |
今後IV. 溶媒和自由エネルギー計算を行い,可視化された水和水との関係について導入的な研究をおこない,かつIII.ロドプシン・Gタンパク質系のMD系の確立とデータの蓄積を行う. IV.溶媒和自由エネルギー計算;本年度I,IIで得られた特徴的な水和水の分布に関して,それぞれに溶媒和自由エネルギー計算を行う.水和水の数/分布と,タンパク質の溶媒和自由エネルギーの相関の有無を調べる.第1-第2水和層における水分子の密度が,溶媒和自由エネルギーと強い相関を示す[Mizukami et al. IJQC,2012]ことが解っており,水和とエネルギーの相関可能性は高い. エネルギー表示法ではタンパク質のひとつのコンフォメーションに対して溶媒和自由エネルギーが見積もられる.ある程度のアンサンブルを計算するには大きなCPUパワーが必要となる.この問題を回避するために,マイニングによる水和水の可視化に用いるMDとは別に,近似的にタンパク質を剛体として扱ってコンフォメーションを限定したMDを行い,水和水の可視化とともに溶媒和自由エネルギーの計算を行う. 生理的条件下ならびに剛体近似のタンパク質が示すそれぞれの水和現象の違いについては,タンパク質に拘束力を段階的にかけた予備的な研究を行い議論する. III.ロドプシン・Gタンパク質系を用いたMDと解析:本年度の研究を継続するとともに,ロドプシンのメタII中間体およびそのリガンド(GαCT2ペプチド)結合体の立体構造[Choe, Nature, 2011]を用いて,I,II,IVで開発した手法を適用する.リガンドとタンパクの結合に関するMDシミュレーションを行い,可視化による水和水の融合過程の研究,およびそのときの水和自由エネルギー計算を行い,ロドプシン-Gタンパクの結合過程に必要な水和の条件を探索し,水和水の結合反応に関する寄与を議論する.
|
Expenditure Plans for the Next FY Research Funding |
平成25年度に生じた次年度使用額は主に物品費(ワークステーション1台)である.本研究で開発したGMM解析プログラムは完全並列計算が可能であるが,計算速度を上げることを目的にプログラムの改良をおこなうと,ボトルネックはデータの入出力(I/O)速度にあることがわかった.そのためCPU速度よりもI/O速度を重視した計算環境を構築することが重要であるが,現状のプログラムを使う限り購入予定のワークステーション1台では価格に見合った十分な性能を発揮できないことがわかった.そこで研究目的達成と効果的な予算運用を目的に,ワークステーションの購入を一旦延期し,複数台の計算機を用いて高速なI/Oを実現したシステムを構築して使用した. 現在,MDシミュレーションとデータマイニングのシステム全体における効率的なデータの形式と運用について検討しており,I/O速度と大量データのランダムアクセス性,分散処理性の向上が鍵であることがわかっている.この問題を解決するためHadoopなどの分散データ処理システムを導入し,計算機環境を整備する.そのために新たな計算機あるいはワークステーションが必要であり,次年度使用額はそれにあてる予定である.
|