本研究では、アミノ酸配列情報および構造情報の局所部分の一致の数に着目して、タンパク質間の類似度をネットワークのように定義する方法を、新たに構造未知のタンパク質に適用することで、アミノ酸配列だけからタンパク質の機能予測を行う新しい方法の開発を行った。まず、局所構造の両端のα炭素原子間の距離をその局所構造の「端間距離」と定義し、予測2次構造情報と配列プロファイル情報を入力とし、予測端間距離を出力する、サポートベクタ回帰をベースとしたツールを開発した。これを、さまざまな立体構造を含むタンパク質群に適用したところ、ループ長が短いところから長いところまで、予測端間距離と実際の端間距離がよく相関することが明らかになった。とくにループ領域については、これまでβターンなど、端間距離が短いものについては、アミノ酸配列と立体構造との関係性についてさまざまな研究がなされていたが、端間距離が長いものについては研究例が少なく、本研究によって、端間距離が長くなるようなアミノ酸配列傾向がとらえられたことは、局所配列が局所構造を制限し、結果として、タンパク質のフォールディングにおいて、立体構造全体の構造空間がかなり大きく制限されている可能性を示唆する興味深い結果である。また同様の解析を、複合体形成によってディスオーダーからオーダーへ転移することが知られているタンパク質領域に適用したところ、オーダー領域ほどではないが、ランダムよりもよい予測が可能であることが明らかとなった。この局所構造の端間距離予測ツールと、配列一致検出ツール、および2次構造予測ツールを組み合わせたタンパク質機能予測ツールを開発し、その性能を確認することができた。
|