タンパク質の立体構造と機能との間には密接な関係があることは良く知られている事実である。本年度研究では、提案したジオメトリカルフラグメントスペクトル(GFS)表現をもとに、タンパク質立体構造の類似性探索への応用を試みた。最初に、筆者らが先に構築した三次元モチーフ辞書システムから抽出したタンパク質部分構造を例に、GFSに基づく構造類似性評価の妥当性について検討を行なった。ここでは、構成アミノ酸残基をそれぞれひとつの仮想原子とみなし、対応するアルファ炭素の座標を用いて近似して表現した。これらの点の集合から可能なすべての部分グラフ(フラグメント)を列挙し、対応するGFSを生成した。類似度評価の尺度としては、従来のユークリッド距離のほか、Tanimoto係数やCosine係数などの利用とその効果について検証した。ある共通の配列モチーフパターンに対応する三次元部分構造群に対し、GFSに基づく構造類似性探索を試み、その有用性を確認した。さらに、これらGFS特徴空間に着目し、スパニングツリーを用いた構造クラスタリングを試みた。その結果、アミノ酸配列はそのモチーフパターンにマッチするが、実際には該当機能を持たないノイズ成分を分類することができた。また、従来のトポグラフィックインデックスとの比較・検討を行い、従来手法よりもよりよく分子の三次元構造を表現できることを示した。 また、タンパク質の中には複数のポリペプチド鎖やドメインが会合した構造(四次構造)を持ち、高次の機能を発現しているものも多い。本研究では、より高次のタンパク質構造特徴探索を目指し、チェインやドメインの組み合わせ情報をもとにした四次構造分類データベースの開発も併せて行なった。
|