<背景と目的> すでに40種類を超える微生物ゲノムの配列とそのアノテーションが公開され、さらに100種類以上の微生物ゲノム解析の成果が近い将来公開される予定である。したがって、進化系統的に近縁の微生物ゲノムの比較や遠縁の微生物ゲノムの比較から、微生物の進化とその能力をよりよく理解できる可能性が強まっている。しかし、アノテーションの手法や記述の仕方はグループごとに異なり、比較ゲノム解析を行う場合に公開データの再評価が必要になる。そこで本研究では、異なる研究グループからのデータをもとにして信頼性の高い比較ゲノム解析ができるシステムの研究開発を目的とした。 <検討結果> 平成12年度において、多数大量のゲノム情報が公開され次第迅速に収録可能な技術基盤を確立した。すなわち、容易に拡張可能な分散データベースをCORBAで統合し、トランザクションの処理に今後標準的に利用されるであろうXMLを採用した。また、比較ゲノム解析の手法を検証するために、blastを使用して、微生物ゲノムの全ORFを対象として双方向ベストマッチのペアを検出し、そのクラスタリングにおける問題点に検討を加えた。 <考察> 各実験グループからのデータを横断的に再解析するためには、自動処理が望ましい。その第1段階としてクラスタリングの手法を評価し、blastのE-valueに加えて、マッチする長さも考慮することでクラスタリングと機能の対応が改善される可能性が出てきた。
|