研究概要 |
本年度は、構造データベースから抽出したタンパク質の局所構造情報に基づく、ab initio立体構造予測手法の開発を行った。本手法では、まず、構造未知のアミノ酸配列(ターゲットのアミノ酸配列)に対して、連続10残基前後の部分配列に区切り、その部分配列がとり得る局所構造をそれぞれに当てはめ、全体構造を構築する。部分配列および局所構造はオーバラップして組み合わせることで、多様な構造を候補として選び出す。次に、選び出した多数の構造群に対して、全体構造の「タンパク質らしさ」を表現する統計ポテンシャルを計算し,その最小化を行って予測構造を求める。本手法では、部分配列がとり得る局所構造をどう選び出すかが、全体構造の探索を絞り込む上で非常に重要である。そこで、切り出した部分配列と類似性の高い配列の中心の残基がとる主鎖二面角の分布を構造データベースの情報をもとに解析し、より高い確率で正解の二面角付近をサンプリングできるような二面角の確率分布の生成を試みた。部分配列の「類似度」には、(1)ハミング距離、(2)PAM、(3)BLOSUM、(4)HSSPによるマルチプルアライメント(類似構造をとる配列群をアライメントしたもの)の4つの尺度を適用し、これらの類似度をもとに、予測構造の主鎖二面角分布を作成した。All-αのタンパク質SinIとSinRについて構造予測を行ったところ、類似度としてBLOSUMを用いたときが最も良い結果を示し、正解構造とのRMSDがそれぞれ1.6Å、4.6Åという高い精度を達成することができた。局所構造を考慮した類似度と、α、βが混在した構造に対応できるような統計ポテンシャルの検討は、今後の課題である。
|