2016 Fiscal Year Research-status Report
大規模シミュレーションとデータベース解析に基づく蛋白質立体構造予測改良法の開発
Project/Area Number |
16K16142
|
Research Institution | Tohoku University |
Principal Investigator |
城田 松之 東北大学, 医学系研究科, 助教 (00549462)
|
Project Period (FY) |
2016-04-01 – 2018-03-31
|
Keywords | 蛋白質立体構造 / シミュレーション / リファインメント |
Outline of Annual Research Achievements |
本研究の目的は蛋白質の立体構造予測によって得られるモデルを改良(リファインメント)する手法の開発を行うものである。モデルを改良して天然構造に近づけるためには物理に即した力場での構造サンプリングが有用であるが、反面でそのような力場はエネルギー地形が滑らかでなく構造の質を落とす可能性がある。この問題については、モデル内の精度が高いことが分かっている部位に位置制約をかけることと滑らかな経験的ポテンシャルを併用することで解決できると考えられる。このような発想のもとで、平成28年度は立体構造モデルの改良方法の作成を行った。まず、対象となる構造モデルのうち、改良すべき部位と、拘束しておいた方がよい部位を決める方法を検討した。このために、蛋白質の分子内水素結合に注目して、Protein Data Bankの蛋白質立体構造から、蛋白質の主鎖、側鎖が作る水素結合パターンを統計化した。これをもとに、主鎖、側鎖の極性官能基の作る水素結合を評価し、モデルの各残基ごとに改良すべきかどうかを決定する手法を構築している。次に、モデル構造の構造サンプリングに分子動力学シュミレーション(MD)を利用する手法を開発した。構造モデルはX線やNMR構造と異なり、原子の衝突やエネルギー的に不利な共有結合の結合長、結合角を持つことがあり、これらをエネルギー最適化によって除く。また、モデルに含まれていないmissing loopはMODELLERなどを用いてモデリングする。ただし、アミノ酸配列から天然変性領域であることが強く示唆される領域は、安定な構造を取らないと予測されるので、構造サンプリングを容易にするために除いてモデル改良を行う。最後に、サンプリングされた構造の中から経験的ポテンシャルと構造クラスタリングを用いて構造評価を行い、改良構造候補を選別する。このようなモデル改良のパイプラインを作成している。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
平成28年度は蛋白質の立体構造予測モデル改良法の開発として、①入力構造の評価手法の作成、②MDによる構造サンプリング手法の作成、③サンプリング結果の評価手法の作成について、開発を予定しており、これらそれぞれの要素について進捗させることができた。①については入力構造の評価として、既知の立体構造との配列類似度を用いた構造モデルの残基ごとの精度評価に加えて、PDBにある立体構造のデータベース解析から、水素結合パターンの評価によって、残基の局所構造の評価をする手法を作成した。②の構造サンプリングについては、さまざまな質のモデル構造について、MDシミュレーションのための構造の処理を行うためのパイプラインを作成した。構造モデルの中には物理的には不適合なものが含まれているものもあり、これらについて全てのケースに自動的に対応することは難しいケースもあるが、原子間の衝突がなく、共有結合長等が物理化学的な値の範囲内に収まるケースでは、比較的効率的に処理できることが分かった。構造サンプリングは最も計算コストのかかる作業であり、系のサイズや溶媒等条件を適切に設定することが重要であり、これらの点は改良の余地がある。③の構造評価については申請者が作成した統計ポテンシャルの他、さまざまな評価関数を用いることで精度の改善を計っている。研究計画において予定していた大規模データベース解析と分子動力学シミュレーションを用いた蛋白質立体構造モデルの改良手法の構築についてはおおむね順調に推移していると考えている。
|
Strategy for Future Research Activity |
平成29年度には、前年度に作成した構造改良手法の更なる改善と、対象の拡大を目指して研究を進める。手法の改善については、Protein Data Bankのデータベース解析により、主鎖構造の二面角や原子間コンタクト情報等を残基の拘束部位のより精度の高い推定のために活用する方法を検討する。また、これらの局所構造の特徴は構造サンプリング後の構造の選択においても活用することができる。これらの構造改良手法については、CASPの構造リファインメントカテゴリの対象構造に対して適用することでその有効性と精度検証を行う。CASPのデータを使って、パラメータの最適化を行い、パイプラインの公開を目指す。一方、これらの構造予測手法は蛋白質のみの構造だけでなく、低分子やDNA、RNA等との複合体においても相互作用部位の改良等に効果が期待されている。このために、MDシミュレーションにおいて、蛋白質以外の原子を含むリガンド、核酸等の力場を用意し、これらのヘテロな分子にも対応できるようにする。蛋白質と他の分子の相互作用についてはDNA、RNA、ATPなどの頻出するリガンドについてはデータベース解析から頻出する構造の特徴を利用することが考えられるが、それ以外のものについては水素結合や原子間コンタクトを用いて構造の評価を行う。
|
Causes of Carryover |
今年度の物品費として計算機代金を計上していたが、これまで申請者が所持していた計算機に加えて汎用の大型計算機システム等を利用することで本年度の研究を遂行できたため。
|
Expenditure Plan for Carryover Budget |
次年度は大規模計算のために追加で計算機資源を購入予定である。また、成果報告のために論文・学会発表を行うためにも使用する。
|