配列比較では同定できないような遠縁の蛋白質間の類似性検索のため、既知の立体構造データにおけるアミノ酸残基の統計分布から評価した経験的相互作用ポテンシャルを配列と構造間の適合度評価関数として用い、残基の挿入欠失を許すアライメント作成のアルゴリズムを昨年度開発し、配列と構造間の適合性評価能力について詳しい検証を行った。 この評価関数は2体ポテンシャルを含むため、エネルギー最小のアライメントはNP困難の問題となる。我々は、2体ポテンシャルを平均場近似により残基毎のアライメント(対合)確率から評価し、繰り返し法によりself-consistentな残基毎の対合確率を転移行列法により計算した。そのようにして評価した2体ポテンシャルの下、エネルギー最小のアライメントと対合確率の順に残基を対合する確率アライメントの2つの方法によりアライメントを計算した。残基の挿入欠失のためのペナルティは、立体構造上内側の座位程挿入欠失が生じにくいよう設定した。 SCOP蛋白質構造分類データベースに含まれる類似蛋白質対と非類似蛋白質対を用い類似性検出能力を評価したところ、平均的には配列比較と同程度であるが、配列比較では同定できない類似蛋白質対を多数検出できることから、配列比較と相補的に使用できることが確認された。また、確率アライメントにおいて、高い対合確率を持つ残基対はより類似した構造部分に対応することが構造比較により明らかになった。このような特性を持つ確率アライメントは、エネルギー最小/適合度最大のアライメントに比べ、ホモロジー構造予測においては特に有用である。一方、エネルギーポテンシャルを持って構造安定性を計り、適合度を評価する方法の欠点も明らかになった。構造安定性に影響する蛋白質間相互作用の近似的な評価に起因する適合度検出力における限界である。検出力を高めるには、類似構造対類似配列のアライメントが有用であろう。
|