ゲノムにコードされている酵素遺伝子の組み合わせから、その生物種の細胞内で進行している代謝活動を推定することは、生命活動がどのようにゲノムにプログラムされているのかを明らかにするための前段階の作業になるであろう。また、微生物や植物が生産する医薬や染料などの2次代謝物質は、そのほとんどについて生合成経路が未知である。これら天然物の生合成経路を推定することは、有用生物の育種に重要なてがかりをあたえるであろう。そこで、本研究課題では、ある代謝物質の生合成経路を推定するために必要な知識を獲得することを目的とした。はじめに、KEGG PATHWAYデータベースに登録されている酵素反応から、酵素EC番号、基質と生成物の化学構造、反応タイプをそれぞれ抽出した。あらかじめ、反応中心となる原子団約100種類について数値キーを与えた。基質や生成物の化学構造は、それらにふくまれているすべての原子団を数え上げ、それぞれに対応するキーで表現することにした。反応タイプは基質と生成物の化学構造のキーの差として表現した。酵素反応は基質特異性(化学構造の特異性)と反応タイプの2つによって特徴づけられることから、この2つについて、Kohonenニューラルネットワークを用いた分類と、酵素番号による学習を組み合わせたCounter-propaqation法を用いた分類をおこなった。基質特異性はいずれの分類法によっても、明瞭に分類できなかったが、反応タイプについては、酵素EC番号の1桁目のクラス分けとの対応が得られた。これまで、酵素反応に関する知識獲得は、その特殊性のためにほとんど成功例はなかった。本研究の結果は、化学構造キーという離散的な記述パラメータによって、代謝反応(酵素反応)タイプの知識獲得をおこなったものであり、今後、酵素反応や代謝経路の推定に展望を与えたものと評価できる。
|