2017 Fiscal Year Research-status Report
生物活性にもとづいた二次代謝パスウェイにおけるモジュール構造の解明
Project/Area Number |
16K07223
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
金谷 重彦 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (90224584)
|
Project Period (FY) |
2016-10-21 – 2019-03-31
|
Keywords | 二次代謝物質 / アルカロイド / 生合成 / バイオインフォマティクス / データサイエンス |
Outline of Annual Research Achievements |
本研究の研究計画は3種の二次代謝物に関するDB( 1.二次代謝物生合成酵素DB、2.生物種-二次代謝物関係DB、3.二次代謝物-生物活性関係DB)およびその他の代謝パスウェイ情報を活用し、化学構造と生物活性における共通性による二次代謝物の分類を行う。 1で得られたそれぞれの二次代謝物グループに含まれる代謝物を代謝パスウェイ上にマッピングする。代謝パスウェイが既知の代謝物は、実線で表した矢印で連結される。このようにして構築された二次代謝パスウェイグループと代謝パスウェイの情報をもとに、代謝モジュールを定義する。このようにして、二次代謝物グループを代謝モジュールと関連づけることが可能となる。化学構造が決定されている二次代謝物の総数は約5万種であるのに対して、二次代謝パスウェイとして代謝反応が解明されているものは、その1/10にも満たない。そこで、本研究において定義する代謝モジュールに関わる二次代謝物群とこれらと構造類似性を有しかつ生物活性に共通性がある二次代謝物との関係を統合し、代謝パスウエイと生物活性の関係をデータサイエンスにより解明する。代謝経路が未知の二次代謝物の構造から代謝経路を予測することが本研究では必須である。そこで、アルカロイドを中心に、代謝における出発物質を予測することを試みた。アルカロイド化合物は現状で12243種の構造のうち、代謝経路が既知のものは673種であった。代謝経路が解明されているアルカロイド化合物の合成開始物質は、19種のアミノ酸、テルペンなど32種の化合物に集約できる。代謝物の構造をグラフにより表現し、グラフコンボリューションによる深層学習法を活用することにより、出発物質予測を行ったところ、認識率95%という高い精度で予測することが可能となった。このことにより、アルカロイド化合物における代謝モジュール予測の一環として出発物質予測が可能となった。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
グラフコンボリューションネットワークを活用することにより、12243種のアルカロイド化合物の出発物質予測が可能となったことが最大の成果である。アルカロイド化合物における代謝経路が既知のものは673種程度ではあるが、本アルゴリズムの適用により認識率95%という高い精度で、それぞれの化合物における生合成開始物質を予測でき、また、複数の代謝物を開始物質とする経路についても精度よく予測が出来た。このことが当初の計画におけるアルカロイド化合物の代謝経路としてのモジュールを規定することの効率化へとつなげることができた。本年度は、これらのモデュール構造と生物活性の関係性を検討することになるが、当初予定していた範囲を大幅におけるアルカロイド化合物をデータセットとして活用することが可能となった。
|
Strategy for Future Research Activity |
最終年の平成30年度は、アルカロイド化合物における代謝モジュールと生物活性の関係を解明することを目的に、以下のA-Cの項目(A.構造類似性ならびに生物活性の共通性による二次代謝物のクラスタリング、B.二次代謝物クラスの代謝パスウェイマッピング、C.代謝モジュールの抽出)を総合的、体系的に解析を進める。 グラフコンボリューションネットワークを活用することにより、12243種のアルカロイド化合物の出発物質予測が可能となったことが最大の成果である。アルカロイド化合物における代謝経路が既知のものは673種程度ではあるが、本アルゴリズムの適用により認識率95%という高い精度で、それぞれの化合物における生合成開始物質を予測でき、また、複数の代謝物を開始物質とする経路についても精度よく予測が出来た。 すなわち、現状で報告されている12243種のアルカロイド化合物の生合成開始物質として19種のアミノ酸、テルペンなど32種の化合物により定義することができ、代謝経路情報が不明の化合物についても生合成開始物質を高精度で予測することができた。このことが当初の計画におけるアルカロイド化合物の代謝経路としてのモジュールを規定することの効率化へとつなげることができた。当初予定していた範囲を大幅に超えるアルカロイド化合物をデータセットとして活用することが可能となった。平成30年度は、これらの情報を手がかりに、モジュール構造を統計的に推定し、さらに生物活性の関係性を統計学ならびにデータサイエンスによる導く。これにより、二次代謝経路と生物活性創出メカニズムを示唆する考察が可能になると期待される。
|
Research Products
(4 results)