研究概要 |
タンパク質三次元モチーフ構造の解析は、その構造-機能相関解析や立体構造の構築原理解明の問題とも密接に関連する極めて重要な問題の一つである。本年度研究では、配列レベルのモチーフ辞書であるPROSITEを参考に、これに対応する三次元モチーフデータベースの作成を試みた。PROSITEでは一種の正規表現を用いてモチーフパターンを定義している。ここでは立体構造既知のタンパク質情報をもとにこのパターンに一致する部位を検索し、その対応する三次元部分構造(Cα原子の座標情報)を抽出した。PDB(Rel.89)から選択した874タンパク質に対して、PROSITE(Rel.16.0)に登録されている1,299件のパターンを用いてデータベース作成実験を試みたところ、少なくとも一つの三次元構造が対応したモチーフは464件であった。また、複数が対応したものについては必要に応じて構造クラスに分類した。本研究では、注目する二つの部分構造間の対応する全ての2点間(Cα原子間)距離の差の平均値をこれらの相違度と考え、それに基づきクラス分類を行なった。また、同一クラスに属する他の全ての構造との相違度の和が最小のものをクラスの代表構造と定義した。カルシウム結合部位として知られるEF-handモチーフの例では、対応した12件の部分構造が四つのクラスに分類され、このうち孤立するものは本モチーフに該当しないノイズ成分であることが確認できた。さらに、主クラスの代表三次元構造を質問構造として、これまでに開発した三次元モチーフ検索プログラムによる検索を試みたところ、配列パターンをキーとした検索ではヒットしなかった新たなEF-handモチーフの対応部位を検出することができた。以上、本研究で作成したデータベースならびに関連プログラムは局所構造特徴に基づくタンパク質構造情報解析のための有用な情報を提供するものと考える。
|