研究概要 |
ゲノム中のすべての遺伝子/タンパク質を対象とした機能アノテーションは比較ゲノムの基礎として重要である。我々はまず転写因子に対象を絞り、与えられたゲノム情報から全ての転写因子を自動的に選別しうる判定法の開発に取り組んだ。最初に実験的に確かめられた転写因子をSwiss-Protデータベースからすべて収集して、転写因子の最小データセットを作成した。転写因子ではDNA結合ドメイン(DBD)がとくに重要であるため、単独のDBDからなる転写因子や、DBDと他のドメインの組み合せからなるものなど、最小セットの転写因子をすべてパターン化して整理し、判別ルールを作成した。判別ルールは転写因子のファミリーごとに設定する必要があり、その作成には手間がかかるが、一度出来あがると全行程は自動的に処理できる。この自動判別システムを原核生物154種のゲノム配列データに適用して、総数で18,000以上の転写因子を同定した。これらの転写因子は、主要なファミリーと多数のマイナーなファミリーからなる総計52種類のファミリーに分類することができた。真正細菌と古細菌を比較すると、20種類の主要な転写因子ファミリーのうち、半数の10種類は古細菌と真正細菌の両方に共通して存在するが、あとの半数は真正細菌にしか存在しないことが判明した。すなわち、古細菌の転写因子レパートリは真正細菌のそれにほぼ完全に含まれるかたちの包含関係にあり、古細菌の転写因子は相対的に未発達だといえる。以上の結果を論文発表した。 また同様の解析を真核生物に拡張するために、ヒト転写因子の組織的な解析を行いつつある。
|