研究課題/領域番号 |
23K05739
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分43060:システムゲノム科学関連
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
金谷 重彦 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (90224584)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
3,510千円 (直接経費: 2,700千円、間接経費: 810千円)
2025年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2024年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2023年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
|
キーワード | メタボロミクス / 二次代謝 / テルペノイド / フェニルプロパノイド / ポリケタイド |
研究開始時の研究の概要 |
申請者が研究・開発を進めているKNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。本研究では、分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を骨格構造にもとづく代謝経路グループに分類する。なお、分子ハイパーグラフ文法による代謝物分類を、文献情報に基づいて定義された代謝経路グループと対応付けをおこなう。さらに、代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探る。
|
研究実績の概要 |
KNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。メタボローム研究の進展により、二次代謝物の骨格となる化学構造から二次代謝経路の位置をおおよそ決定できる状況にある。そこで、[1]分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を、骨格構造にもとづく代謝経路グループに分類する。なお、分子ハイパグラフ文法による代謝物分類を、文献情報に基づいて定義された代謝経路グループと対応付けをおこなう。さらに、[2]代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探るとともに、[3]公開されているメタボロームにおける質量分析データにおける代謝経路グループへの分類を検討し、メタボロームデータの解釈の向上を目指す。 そこで、2023年度は、KNApSAcK Core DBにm含まれる3種の原子(C,H,O)から構成される36,974種の代謝物を対象に、分子ハイパーグラフ文法にもとづいた化合物の分類から、さらに、主要二次代謝経路として、テルペン生合成経路、フェニルプロパノイド生合成経路、ポリケチド生合成経路絞り、19769種の代謝物のについて3階層の分類体系を構築し分類した。第3階層において これもとに、代謝物の分子フィンガープリントを記述子とした機械学習ににより分類モデルを構築した。なお、代謝経路既知の63クラス[テルペノイド生合成(10クラス)フェニルプロパノイド生合成経路(37クラス)、ポリケタイド生合成経路(26クラス)]としたところ95%の精度で正しく分類出来た。これをもとに、化学構造からの代謝経路クラスの分類が可能であることを示すことができた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
「分子ハイパーグラフ文法ならびに分子グラフ深層学習法を活用し、全ての二次代謝物を骨格構造により分類し、代謝経路と関連付ける」のが本申請の目的であり、1年目にして、KNApSAcK Core DBにm含まれる3種の原子(C,H,O)から構成される36,974種の代謝物を対象に、分子ハイパーグラフ文法にもとづいた化合物の分類から、さらに、主要二次代謝経路として、テルペン生合成経路、フェニルプロパノイド生合成経路、ポリケチド生合成経路絞り、19769種の代謝物のについて3階層の分類体系を構築できた。また、代謝物を分子フィンガープリントとして記述し、機械学習ににより分類モデルを構築できた。このモデルを活用すれば、マニュアルキュレーションでは、分類できなかった代謝物についても代謝経路既知の63クラスへの分類可能性を示すことができる。そのために、2年目には、二次代謝物の分類体系化が完了できることから、上記の進捗区分とした。
|
今後の研究の推進方策 |
KNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。メタボローム研究の最大代謝研究の進展により代謝物において、その骨格となる化学構造から二次代謝経路の位置をおおよそ決定できる状況にある。1-2年目の目標として[1]分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を骨格構造にもとづく代謝経路グループに分類することである。2年目の本年においては、ここまでで培った、代謝経路グループをさらに更新し、分子フィンガープリント法と機械学習の結果を踏まえ、二次代謝物の代謝経路グループに帰属を充実させる。ここで、機械学習の結果をさらに構造類似性から精査することにより、二次代謝物の代謝経路グループへの帰属について妥当な代謝物のみを、代謝経路グループへの残す。このようにして、現在の19769種の代謝物からなる代謝経路グループをさらに、拡充することを目指す。また、「代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探るための、活性情報の整理を進めて行く。これにより生物間相互作用の観点から、二次代謝経路の構築原理を探る。
|