タンパク質の立体構造と機能との間には密接な関係があることは良く知られている事実である。本年度研究では、提案したGFS表現をもとに、タンパク質立体構造の類似性探索への応用を試みた。タンパク質全体構造への適用に際しては、タンパク質構造中のある特定アミノ酸残基、例えば、その構造が最も単純で(すなわち構造的な自由度が最も高く)、かつ出現頻度が比較的高いグリシン残基に注目し、全体構造をその中に含まれるグリシン残基に対応する点の集合として表現する。このような表現をもとに、グリシン残基間距離(対応するアルファ炭素の原子間距離)の情報をもとに、そのGFSを生成する。このような表現を行なうことにより、フラグメント列挙に関わる組み合わせ爆発を防ぐとともに、主鎖の向きを変えるターン領域など、構造的に重要な役割を果たしていると思われる部位の特徴を強調して表現することが可能となる。 最新のPDB(Protein Data Bank)から調整した実験用データセットを作成するとともに、これらに対する網羅的な構造分類を試みた。例えば、ニトロゲナーゼ(1NIPA)をクエリーとした構造類似性検索の結果、類似度上位に多くの興味深い構造を見出すことができた。このうち、1CP2Aはクエリー分子と同じタンパク質ファミリーに属しており、そのアミノ酸配列や折り畳みのパターンが類似している。従って、グリシン残基の空間的位置も比較的類似していることが予想され、このことは視覚的にも確認できる。一方、DNA結合タンパク質(1GCB)はクエリー分子とはその全体構造のサイズが大きく異なり、その折り畳みのパターンも全く異なる。しかしながら、二つのタンパク質分子のグリシン残基の空間的配置に注目すると、非常に類似していることが分かった。これらの結果は、タンパク質三次元構造特徴探索における本法の有用性を示すものである。
|