研究概要 |
昨年度までに、ゲノム配列が公開されているバクテリア44種を対象として、転写因子と想定されるORFを網羅的に収集し、主にDNA結合領域のアミノ酸配列に基づいて60以上のタンパク質ファミリーに分類した。今年度はさらに最近ゲノム配列が決定された高GCグラム陽性菌5種を加えて計49種とし、これまでのものと合わせて計8,000個余りのORFについてファミリー分類を行った。 収集された配列をもとに、各転写因子ファミリーについて高品位のマルチプルアラインメントを作成し、ドメインごと(ドメイン情報がないファミリーについては保存領域ごと)のHMMモデルを構築した。helix-turn-helix型のDNA結合ドメインをより細かく分類するなどの工夫により、Pfam等の既存のドメインデータベースと比較して、総じてより高い検出感度と精度が得られることがわかった。これらのHMMモデルの公開準備を進めるとともに、HMMの検索結果とドメインの組み合わせ情報を使って、新規の配列から転写因子を精度よく予測するシステムの開発を行っている。 機能未知の転写因子について標的遺伝子を同定する目的で、in vitroでの特異的なDNA結合能を利用して、ゲノムライブラリから標的配列を選別する方法を構築した。この方法を大腸菌の転写因子CRPに応用し、ゲノム上に新規のCRP結合領域を15個所以上同定することができた。これらのDNA領域の大半は、200bp程度以上の非翻訳領域を含み、またDNaseIフットプリンティングによってCRPおよびRNAポリメラーゼの結合を確認することができた。さらに共同研究として、大腸菌の二成分制御系の転写因子等について、この方法を使った標的遺伝子の同定を行った。
|