Project/Area Number |
23K05739
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 43060:System genome science-related
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
金谷 重彦 奈良先端科学技術大学院大学, データ駆動型サイエンス創造センター, 教授 (90224584)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,510,000 (Direct Cost: ¥2,700,000、Indirect Cost: ¥810,000)
Fiscal Year 2025: ¥520,000 (Direct Cost: ¥400,000、Indirect Cost: ¥120,000)
Fiscal Year 2024: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
|
Keywords | メタボロミクス / 二次代謝 / テルペノイド / フェニルプロパノイド / ポリケタイド |
Outline of Research at the Start |
申請者が研究・開発を進めているKNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。本研究では、分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を骨格構造にもとづく代謝経路グループに分類する。なお、分子ハイパーグラフ文法による代謝物分類を、文献情報に基づいて定義された代謝経路グループと対応付けをおこなう。さらに、代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探る。
|
Outline of Annual Research Achievements |
KNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。メタボローム研究の進展により、二次代謝物の骨格となる化学構造から二次代謝経路の位置をおおよそ決定できる状況にある。そこで、[1]分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を、骨格構造にもとづく代謝経路グループに分類する。なお、分子ハイパグラフ文法による代謝物分類を、文献情報に基づいて定義された代謝経路グループと対応付けをおこなう。さらに、[2]代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探るとともに、[3]公開されているメタボロームにおける質量分析データにおける代謝経路グループへの分類を検討し、メタボロームデータの解釈の向上を目指す。 そこで、2023年度は、KNApSAcK Core DBにm含まれる3種の原子(C,H,O)から構成される36,974種の代謝物を対象に、分子ハイパーグラフ文法にもとづいた化合物の分類から、さらに、主要二次代謝経路として、テルペン生合成経路、フェニルプロパノイド生合成経路、ポリケチド生合成経路絞り、19769種の代謝物のについて3階層の分類体系を構築し分類した。第3階層において これもとに、代謝物の分子フィンガープリントを記述子とした機械学習ににより分類モデルを構築した。なお、代謝経路既知の63クラス[テルペノイド生合成(10クラス)フェニルプロパノイド生合成経路(37クラス)、ポリケタイド生合成経路(26クラス)]としたところ95%の精度で正しく分類出来た。これをもとに、化学構造からの代謝経路クラスの分類が可能であることを示すことができた。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
「分子ハイパーグラフ文法ならびに分子グラフ深層学習法を活用し、全ての二次代謝物を骨格構造により分類し、代謝経路と関連付ける」のが本申請の目的であり、1年目にして、KNApSAcK Core DBにm含まれる3種の原子(C,H,O)から構成される36,974種の代謝物を対象に、分子ハイパーグラフ文法にもとづいた化合物の分類から、さらに、主要二次代謝経路として、テルペン生合成経路、フェニルプロパノイド生合成経路、ポリケチド生合成経路絞り、19769種の代謝物のについて3階層の分類体系を構築できた。また、代謝物を分子フィンガープリントとして記述し、機械学習ににより分類モデルを構築できた。このモデルを活用すれば、マニュアルキュレーションでは、分類できなかった代謝物についても代謝経路既知の63クラスへの分類可能性を示すことができる。そのために、2年目には、二次代謝物の分類体系化が完了できることから、上記の進捗区分とした。
|
Strategy for Future Research Activity |
KNApSAcK Core DBは、生体内の代謝物を動態の全体像を把握する研究分野であるメタボロミクス研究における世界の中核DBとして認知されるに至っている。メタボローム研究の最大代謝研究の進展により代謝物において、その骨格となる化学構造から二次代謝経路の位置をおおよそ決定できる状況にある。1-2年目の目標として[1]分子ハイパーグラフ文法を活用し、KNApSAcK Core DBに含まれる全ての代謝物を骨格構造にもとづく代謝経路グループに分類することである。2年目の本年においては、ここまでで培った、代謝経路グループをさらに更新し、分子フィンガープリント法と機械学習の結果を踏まえ、二次代謝物の代謝経路グループに帰属を充実させる。ここで、機械学習の結果をさらに構造類似性から精査することにより、二次代謝物の代謝経路グループへの帰属について妥当な代謝物のみを、代謝経路グループへの残す。このようにして、現在の19769種の代謝物からなる代謝経路グループをさらに、拡充することを目指す。また、「代謝経路グループをもとに植物種ごとの代謝にもとづく生存戦略を探るための、活性情報の整理を進めて行く。これにより生物間相互作用の観点から、二次代謝経路の構築原理を探る。
|