研究概要 |
文献から収集した確かな膜貫通(TM)トポロジーデータセットに対して、最大の予測精度を与える既存予測法の組み合せを決定した(ConPred_all及びConPred_elite)。ConPred_allは既存の予測法に比べて10%程度の精度向上、ConPred_eliteは予測対象を20-30%に限定することによってほぼ100%の予測精度を実現している。この2つを統合したConPred IIをインターネット上に公開した。88原核ゲノムから予測されるTMタンパク質配列約52,000配列を対象として、まず、BLAST検索及び配列一致度比較によって得られる機能注釈付けの割合を求めたところ、そのレベルは24%程度であった。TMトポロジー類似性に基づくクラスタリングを行うことによって、機能分類・同定の割合を61%のレベルにまで引き上げることができることを明らかにした。TMトポロジー類似性は、我々が新たに導入した概念であり、対応するループの長さを比較することによって簡単に求めるものである。また、このクラスタリングに用いられたTMトポロジー予測データは、ConPred IIを適用することによって得られたものである。 さらに、88ゲノムから得られた52,000配列を対象として、そのTMトポロジー情報を利用した、配列内部分配列比較を行うことによって、遺伝子内重複によるTMトポロジー進化についても詳しく調べた。TMトポロジー進化には、二倍体型、準二倍体型、三倍体型、入れ子三倍体型、部分的重複など、様々なタイプが見いだされた。例えば、6回貫通型TMタンパク質は、2回型から2回重複を繰り返した3倍体型重複、4回貫通型からの部分的重複、入れ子3倍型重複によって進化したものであることが分った。また、7回貫通型TMタンパク質は、3回貫通型、4回貫通型、5回貫通型から進化したものである可能性があることを明らかにした。
|