本研究の目的は、異種生物種間の代謝反応ネットワークの比較を行うことである。そのため、本年度はまず代謝反応ネットワークのデータベースのモデルを提案した。そして、MetaCycのフラットファイルデータを元に、大腸菌(Escherichia coli)のデータベースを構築した。しかし、これには化合物の構造式にあたる情報が含まれていない。そこで、MetaCycの化合物データのSMILES情報から、MESA(http://www.mesaac.com/)のFingerprintモジュールを利用し、MDLの分類に基づいた164bitのbit-stringデータを生成し、本データベースに追加している。 そして、作成したデータベースを利用して、代謝経路を再構築するアルゴリズムを実装した。具体的にはダイクストラのアルゴリズムを用いており、入力として与えられた2つの化合物を頂点とする最短経路を求める。しかし、代謝反応ネットワークの場合に、単純に最短経路を求めると、水やATPなどの補因子と呼ばれる物質を経由し、生物学的に間違った最短路を求めるという問題がある。そこで、作成したシステムでは、反応を構成する2つの化合物の類似度を、その構造式のbit-string間のTanimoto係数と、分子量に基づき求める方法を実装し、自動的に補因子に当たる経路を除外している。 実際に、作成したシステムを用いて、大腸菌の解糖系にあたる、beta-D-Glucoseから、Pyruvateまでの最短経路を求めたところ、正確にその経路を再構築することができた。
|