蛋白質-蛋白質ドッキング手法を用いて蛋白質複合体構造の予測を行うと、ターゲット蛋白質複合体の立体構造がそれほど複雑でなかった場合や、優れたドッキング手法を利用した場合には、生物学的に意味があると考えられる複合体モデル(真モデル)を得ることができる。しかし、同時に多数の偽複合体モデルも作成されてしまうため、大多数の偽モデルの中から少数の真モデルを選び出す評価方法が必要となる。そこで、「真モデルの蛋白質-蛋白質相互作用面は偽モデルの相互作用面に比べて、蛋白質分子表面上の物理化学的物性と形状の相補性がより高い」という仮定を基に、真モデルを選び出す評価法の開発を行った。 ターゲット蛋白質複合体として、立体構造既知の重複のない125ヘテロダイマーをPDB(Protein Dana Bank)より選出し、まず初めに、共同研究者が開発したドッキング法を利用して、ターゲット毎に最大500個の複合体モデル構造を発生させた。そして、全ての複合体モデルに対して蛋白質分子表面上の物理化学的特徴(疎水性、静電ポテンシャル)と形状の解析を行い、相互作用面における物性と形状の相補性度合いを定歴化した。これとは別に、ターゲットであるヘテロダイマーの実験構造(X線結晶構造)を、相互作用面の形状や全体構造という観点から観察を行ったところ、これらのヘテロダイマーは相互作用面の形状に従って2分類することが可能であり、さらにこの形状による分類は、高いドッキングスコアを持つ真モデルの数による分類、すなわちターゲットの難易度と相関のある事がわかった。真モデルの抽出は、特に難易度の高いターゲットにおいて重要であるため、難易度が高いと判定された75ターゲットのみを用いて評価法の作成を行っている。現在までのところ約7割のターゲットに対して、真モデルを上位にランクし、偽モデルとの差別化を行うことができている。
|