研究課題/領域番号 |
23KJ0506
|
研究種目 |
特別研究員奨励費
|
配分区分 | 基金 |
応募区分 | 国内 |
審査区分 |
小区分39010:遺伝育種科学関連
|
研究機関 | 東京大学 |
研究代表者 |
吉岡 勇人 東京大学, 農学生命科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2023-04-25 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,000千円 (直接経費: 2,000千円)
2024年度: 1,000千円 (直接経費: 1,000千円)
2023年度: 1,000千円 (直接経費: 1,000千円)
|
キーワード | マルチオミクス / ゲノミクス / メタボローム / マイクロバイオーム / 機械学習 / 混合モデル |
研究開始時の研究の概要 |
マルチオミクスデータを用いてダイズ収量を予測する回帰モデルを構築し、 植物-根圏微生物の相互作用に関与する因子を探索する。令和5年度にはカーネル主成分分析を用いて非線形な次元削減と、中間形質(メタボローム)を予測値に代替するモデルの開発を行う。令和6年度には、フランスAgroParisTech のチームの協力のもと、機械学習モデルを応用し、より精度の高い予測モデルを開発する。
|
研究実績の概要 |
本研究では、植物ゲノムと根圏メタゲノム・メタメタボロームデータをもとに、マルチオミクスデータを組み合わせて植物の表現型を予測する手法を開発した。 本手法の開発には、ダイズ198系統の圃場実験で得られた全ゲノム配列、根圏微生物叢中の根代謝物濃度(メタメタボローム)、根圏微生物叢の16S配列データ(メタゲノム)、ダイズ表現型データを用いた。モデルに入力する変数の次元を小さくするために、ゲノムワイドなマーカー遺伝子型データから線形カーネル(ゲノム関係行列)を算出した。根圏メタゲノムおよびメタメタボロームデータについては、サンプル間の関係を表す行列を算出した。ゲノム予測で広く用いられている最良線形不偏予測(BLUP)と、シンプルだが汎用性の高い機械学習手法であるランダムフォレスト(RF)を比較した。我々はデータに2段階のモデルを適用した。すなわち、モデルは第一段階で中間形質としてメタメタボロームプロファイルを予測し、次に植物ゲノムとメタゲノムのデータと予測されたメタメタボロームプロファイルに基づいて植物の表現型を予測した。このモデルは、まず古典的なBLUPに限定して線形モデルによる予測精度を検証し、後にRFモデルと比較して評価した。このような手法の提案は、メタボロームを取得することなく高い収量予測を得られることから、農学的、育種的に有意義と考えられる。さらに、RFモデルにおける変数の重要性は、マルチオミクスデータ間の相互作用を明らかにする可能性がある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究は順調に進行しており、植物の表現型を予測するための新しい手法の開発が行われている。この手法では、植物のゲノムデータと根圏メタゲノム・メタメタボロームデータを組み合わせ、マルチオミクスアプローチを採用している。さらに、根圏メタゲノムおよびメタメタボロームデータについては、サンプル間の関係を表す行列を算出し、これらのデータを用いて植物の表現型を予測するためのモデルを構築している。このモデルでは、最初にメタメタボロームプロファイルを中間形質として予測し、その後、植物のゲノムとメタゲノムデータと予測されたメタメタボロームプロファイルに基づいて、植物の表現型を予測した。この手法では、従来のBLUP(最良線形不偏予測)とランダムフォレスト(RF)を比較し、特にRFモデルにおける変数の重要性の解析を行っている。その結果、RFモデルがより高い予測精度を示す可能性が示唆され、また、RFモデルにおける変数の重要性解析から、マルチオミクスデータ間の相互作用を明らかにすることができる可能性が浮かび上がっている。さらに、根粒菌と特定の根代謝物の相関関係など、生物学的な発見もあった。これらの成果は、農学的、育種的な観点から非常に有益であり、将来的には植物の収量予測や品質改良に貢献することが期待されている。
|
今後の研究の推進方策 |
現在、多変数の解析における予測の問題に取り組んでおり、その解決策として潜在変数モデルの開発を進めている。これにより、複雑なデータセットからの効果的な予測が可能になると期待されている。予備的な試行では、良好な結果が得られており、この方向性が有望であることが示された。次のステップとしては、この潜在変数モデルをRのパッケージとして実装し、公開する予定である。これにより、他の研究者やデータサイエンティストが容易に利用できるようになり、さらなる研究や応用が促進されることが期待されている。また、他の予測モデルとの比較を行い、提案手法の優位性や特性を明らかにするための詳細な分析を行う予定である。この比較により、提案手法の有用性や適用範囲をより詳細に理解し、研究の進行方向をさらに洗練させることができる。最終的に研究成果をまとめ、論文として投稿する予定です。この論文では、潜在変数モデルの提案、実装方法、予測性能の評価結果などが詳細に記載され、学術界や産業界における関心を集めることが期待される。また、学会での発表も計画している。こうした場での発表を通じて、他の研究者との議論やフィードバックを得ることで、研究の信頼性や有用性を向上させるとともに、さらなる研究展開の機会を模索していく予定である。
|