2010 Fiscal Year Annual Research Report
真菌を含む微生物メタゲノムからの遺伝子予測および種分類
Project/Area Number |
22710203
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
野口 英樹 東京工業大学, 大学院・生命理工学研究科, 特任准教授 (50333349)
|
Keywords | メタゲノム / 生物情報科学 / 遺伝子予測 |
Research Abstract |
本研究では、真核生物を含むメタゲノム配列断片から遺伝子領域を予測するための情報科学的手法の開発を目指している。本年度は、遺伝子予測上特に重要なダイコドン頻度の推定モデルおよびスプライス部位の推定モデルを構築した。ダイコドン頻度は生物種ごとに異なるため、遺伝子予測の際にはその種にあった頻度モデルを用いる必要がある。本研究では、真核生物のダイコドン頻度も原核生物同様、ゲノムGC含量から推定可能であることを見いだし、ロジスティック回帰モデルを構築した。一方で、タンパクのコード領域とそれ以外の領域ではGC含量が有為に異なる(全生物種でコード領域のGC含量の方が高い)ことが分かった。この事は、短いメタゲノム断片のGC含量をそのまま全ゲノムのGC含量の推定値として用いることの危険性を示している。今後は、上記問題の遺伝子予測への影響を調べ、必要であれば真核生物に適したダイコドン頻度推定法を考える。スプライス部位を生物種ごとに比較したところ、基本的にはいずれの種もGT-AGルールに従う共通性の高いモチーフを持つ事が分かった。より詳細にみると、ドナー部位のパターンは子嚢菌門の一部とそれ以外の真菌・原生生物とに大別できる事がわかったが、これは遺伝子中のイントロン数と関係している事が示唆された。今後は、今回構築したモデルを組み合わせた、最終的な遺伝子予測プログラムを開発する。
|