研究課題/領域番号 |
16K07223
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
金谷 重彦 奈良先端科学技術大学院大学, 情報科学研究科, 教授 (90224584)
|
研究期間 (年度) |
2016-10-21 – 2019-03-31
|
キーワード | 部分環骨格構造 / 代謝パスウエイ / クラスター分析 / 代謝モジュール |
研究実績の概要 |
本申請では、生物と生産される二次代謝物の関係DB、二次代謝物と生物活性の関係DB二次代謝物の酵素反応DBの情報を活用し、三次元構造類似性と共通の生物活性にもとづいて5万種の二次代謝物を分類する。分類された代謝物を二次代謝パスウェイ上にマッピングし、代謝モジュールを抽出する。代謝モジュール情報をもとに生物系統群ごとに創出される代謝パスウェイと生物活性の関係を体系化し、ゲノム情報にもとづいた代謝パスウェイ創出と生存戦略の関係を悉皆的に把握することを目指す。 まずはじめに、植物、微生物が生合成するアルカロイド化合物に注目し、代謝経路を構築した。文献調査により478種の化合物において代謝経路が既知である。これら478種の化合物に含まれる全ての部分環構造(2546種)に基づいて、それぞれの化合物の部分環骨格構造の有無によるベクトルで表現し、化合物間の類似性を評価するシステムの開発を進めた。部分環骨格構造をSubring Skeleton (SRS)と呼ぶ。SRSの類似性によるクラスター分析により、上記の478種の化合物について、29種類のクラスターに分類した。その結果、良好にSRSにより、アルカロイド化合物を分類することが可能になった。一見、非常に複雑な環骨格構造を有する化合物においても、代謝上の開始化合物の特徴が含まれており、代謝経路ごとの環骨格構造の多様性導出のメカニズムを体系的把握することに成功した。現在までに整理が進んでいる12,243種のアルカロイド化合物のうち、25%は集積された代謝経路既知化合物とSRSが同一であり、代謝経路を同定することができる。一方、残りについては、SRSの類似性から代謝経路を予測することが可能となった。これらの分類結果を踏まえて、それぞれおの代謝経路モジュールに属するアルカロイド化合物と活性情報の共通性を体系化し本プロジェクトの目的を達成したい。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
化合物間の部分環骨格構造Subring Skeleton (SRS)による代謝物の分類において、化合物の部分環構造の有無でベクトルを構築することが、最大の難点であった。これを克服するためのアルゴリズムの開発するために、InChI(International Chemical Identifier)を活用した。このInChIキーは、原子間の結合行列により対象とする環骨格構造を一意に文字列表現する方法である。そこで、本研究で対象とした478種の化合物の側鎖を全て削除し、InChIキーにより一意に全ての部分環骨格構造を抽出した。それぞれの化合物については全ての部分環骨格構造と対応したInChIキーの有無によりベクトルで表現することにより、ベクトルの比較から、478種の化合物骨格構造の類似性を的確に把握することが可能となった。さらに、Zero-suppressed binary decision diagrams (ZDDs)によるベクトル構築の計算の効率化を進めており、プログラミングもほぼ完了した。一方、抽出された代謝モジュールに含まれる化合物の活性情報についての調査を現在開始しているところである。平成28年度の予定のアルゴリズム開発はほぼ完了した。また、代謝経路が既知の代謝物を対象に部分環骨格構造フィンガープリントから代謝経路を識別する学習アルゴリズムを開発をすすめることができた。代謝物の化学構造における側鎖を中心としたフィンガープリント法については、PubChem, CDK、MACCSなど世界においてさまざまな方法が開発されているものの、部分環構造に注目するフィンガープリント法は今のところ開発されておらず、本申請独自のアイデアである。この方法により代謝物が代謝モジュールに高精度で分類し、活性情報へと関係付ける学習アルゴリズムの開発を展開する予定である。
|
今後の研究の推進方策 |
本申請では、二次代謝物の三次元構造類似性とともに生物活性の共通性を考慮した、代謝モジュールを抽出することが目的である。そのために、二次代謝物間の三次元構造類似性を評価するとともに各々の代謝物についての生物活性情報の充実を図る必要がある。数値目標としては、少なくとも、対象とする二次代謝物の数(5万種)の1/10 (5千種)について活性情報を科学文献情報から抽出し、本研究に活用することを目標としている。そこで、まずはじめに、アルカロイド化合物の活性情報を文献に基づいて収集し、生物活性の記述における用語のオントロジーを作成する。 環骨格構造の類似性ならびに生物活性の共通性による二次代謝物のクラスタリングについては、アルカロイド化合物について良好の結果が得られたため、さらに、テルペン類、フラボノイド類などを含めた二次代謝物の分類へと展開することを予定している。また、環骨格構造類似性と生物活性共通性の二つの因子を考慮した二次代謝物の分類としてDPClusアルゴリズムを用いることを計画している。本アルゴリズムは、対象を頂点、関係性を辺で表したネットワーク情報をもとに、対象がお互いに密に結合する領域を抽出することにより、対象間が密につながったサブネットワーク(二次代謝物グループ)を抽出する。階層的クラスタリングにおけるグループ構築と異なり、DPClusでは常に対象間の類似性をネットワークとして考慮しグループを構築するという特徴を有している。そのため、最終的に抽出されるサブネットワークには複数の要素間の関連性が強く反映される。このようりして、生物活性とつよく関連する代謝モジュールの抽出を行い、生物の生存戦略としての二次代謝物の役割を、代謝モジュールにより特徴づけることを検討する。
|