研究概要 |
ゲノム情報からタンパクドメインをコードする領域を精度よく予測することは、立体構造や機能の予測を行う前の段階として重要である。本研究では、タンパク既知タンパクより計算したアミノ酸間平均距離のデータに基づき定義されたコンタクトマップ(Average Distance Map,ADM)を用いてORFのドメイン領域の位置の予測法の開発を目的とする。また、タンパクドメインのフォールディング機構についても解析を行う。これは、アミノ酸配列からドメイン領域を予測するにあたり、配列の違いが立体構造の違いか、フォールデイング機構の違いかを判断するのに重要である。 脂肪酸結合蛋白(1IFC)、レチノイン酸結合蛋白I(1CBI)、レチノイン酸結合蛋白II(1OPA)の3つの蛋白は立体構造が類似しているにも関わらずフォールディング機構が異なっている。今回は、ADM法をこの3つのタンパクに適用し(図参照)、マップの差異を解析した。その結果、ADMで予測されるコア領域間の相互作用の違いがフォールデイングの違いを反映することがわかった。 さらに、本方法を実際のゲノム配列解析より得られたORFへの試みた。ここでは、国立遺伝学研究所で開発されたゲノム構造予測データベースGTOPのデータを利用した。このデータベースではPSI-BLASTによりORFのドメインの位置の推定が行われており、その検索結果と比較した。その結果、ADM法で予測したドメイン領域は、より小さい構造単位である構造ドメインを予測する傾向にあることがわかった。 ADM法は、その全体のパターンはタンパクの最終立体構造情報を含むが、部分構造を細かく比較するとフォールディング機構の差異を予測することができる。また、ORFに適用した場合、構造単位の位置を予測するが、それが一つの機能単位に含まれるか、別の機能単位かを判別する方法がさらに必要がある。
|