研究課題/領域番号 |
24770159
|
研究機関 | 独立行政法人理化学研究所 |
研究代表者 |
松永 康佑 独立行政法人理化学研究所, 粒子系生物物理研究チーム, 基礎科学特別研究員 (60464525)
|
研究期間 (年度) |
2012-04-01 – 2014-03-31
|
キーワード | タンパク質 / シミュレーション / 分子動力学 / 統計数理 / 機械学習 |
研究概要 |
近年の計算機パワーの進歩によって、分子動力学計算によってタンパク質のフォールディングや、生物機能に関わる構造変化を全原子レベルの解像度で観察することが可能となってきている。しかしながら、そこから意味のあるオーダーパラメータを抽出して、構造のアンサンブルを統計的に記述し理解するためには、統計数理の手法(機械学習や最尤推定・ベイズ推定)を駆使する必要がある。この統計解析を効率的に実行し、特にタンパク質向けの有効な手法を開発・応用するために、統計解析フレームワークの基幹部分をMATLABで実装し公開した(https://github.com/ymatsunaga/mdtoolbox)。具体的には以下の機能を実装した: 基本的な入出力(AMBER/CHARMMのパラメータ・トポロジー・トラジェクトリファイルの入出力(一部は入力のみ)、指定距離内のペアリストを効率的に求めるルーチン(Grid-cell algorithm)、原子選択ルーチン(文字列選択、インデックス選択、距離選択)、構造計算(最小二乗フィッティング・原子間距離・角度・二面角・慣性半径・距離行列・コンタクトマップなど)、クラスター分析(K-means・K-center・Information-based clustering)、最尤法(Weighted Histogram Analysis Method・Multistate Bennett Acceptance Ratio Method)、ダイナミクスの統計解析(遷移行列推定・マルコフ遷移モデル構築)。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
統計解析のフレームワーク実装は順調に進んでいるが、研究目的とするタンパク質構造変化の新規な統計解析を応用し新しい知見を得る段階まではまだ達成できていない。その理由は主に二つある:1)開発した成果を誰でもすぐ利用できるように今年度は基幹部分の実装に注力しすぎた(CHARMM/AMBER両方の対応、原子選択など)。2)解析の最終ターゲットとする多剤排出トランスポーター(AcrB)の構造変化シミュレーションが遅れている。次年度は、応用部分の実装に注力するとともに、AcrBの構造変化シミュレーションを加速する。
|
今後の研究の推進方策 |
統計解析フレームワークの基幹部分の実装は終了したので、今後は応用部分の実装・応用に注力する。また、今年度は研究成果の発表が、どちらかといえばシミュレーション結果の副次的なものに留まっていた。今後は、解析フレームワーク・手法をメインとして広く成果を発表していく予定である。
|
次年度の研究費の使用計画 |
今年度は統計解析法の実装に用いているMATLABを計上していたが、既に研究室で購入したものがありそれで済ませたために当該研究費が生じた。次年度は、主に解析に用いるHDDと成果発表のための旅費に使用する予定である。
|