500以上にも上るコンプリートゲノムの情報や数百にも上る分子生物学の公共データベースに蓄積されている情報、そして、近年急速に発展しているトランスクリープトーム・プロテオーム・メタボロームなどのハイスループットな手法による綱羅的データを統合的にシステムバイオロジーの方法により融合させることで、データマイニングとシミュレーションを駆使した生命のシステムとしての理解を促進できる。このためにはコンピュータシミュレーションを用いた構成諭的アプローチが不可欠であるが、この為に必須であるモデリングは現在非常に煩雑な人手による作業に依存しており、また様々な生命情報を統一的に扱える作業環境が存在していないことも計算綱胞生物学が発展する上で大きな障害となっている。本研究ではまず汎川的なバイオインフォマティクス解析環境であるG-language Bioinformatics Environmentを設計・実装し、その上で、ゲノム情報に基づいた代謝パスウェイモデルを自動生成するGEM Systemを開発した。さらに、得られた複雑なパスウェイ情報を効率よく理解するための可視化ツールも開発した。ゲノム情報に基づくモデルの構築は機能アノテーションと通ずる部分も多いため、再アノテーション技術によりこれをより高精度かつ高速に行えるようになった。
|