ゲノム研究の対象が多様な生物種に拡大され、特に微生物では100を越える種がすでにゲノム解析のターゲットとなっている。そこで、これらの情報からゲノムの多様性の実体と、その背景にある進化機構を明らかにするための、情報学的手法の開発が望まれている。本研究は、特に微生物ゲノムをターゲットとして、複数のゲノム構造を同時に比較し、各ゲノムおよび遺伝子群の特徴づけを行う計算手法の開発、ならびにそれらの結果から進化機構に関する知見を探索するためのシステムの構築を目標として行った。。 ゲノム構造を比較するためにはオーソログを同定する必要があるため、まずオーソログ分類について検討した。オーソログ同定は遺伝子単位のべストヒットで行われることが多いが、一般にはドメイン単位で対応づける必要があるため、ドメイン分割を行いながら階層的クラスタリングを行うアルゴリズムを開発した。この手法で実際に分類を行ってみると、ドメイン分割されているケースでもゲノム上連続したセグメント上にあるケースが多く、オペロンが保存されているケースも含めて、ゲノム上のセグメントを考慮した対応づけを行う必要があることが示唆された。そこで、連続したセグメント上の類似性を加算評価するようにアルゴリズムの拡張を行った。COGなどの手作業を交えて行われた既知の分類結果と比較したところ、アルゴリズムの改善により両者が一致するケースが増加することが確認された。 本手法により、大規模なゲノムの比較を効率よく進めることが可能になった。今後は特にゲノム中の多様な部分に注目して遺伝子やゲノムの特徴づけを行っていくことが課題となる。その際、遠縁ゲノムの比較からは、種固有な遺伝子について十分な情報が得られないという問題があり、近縁ゲノムの比較がむしろ重要になってくる。これに関しても、近縁ゲノム比較解析ツールの開発を並行して行っており、今後活用を図っていきたい。
|