研究領域 | デジタルバイオスフェア:地球環境を守るための統合生物圏科学 |
研究課題/領域番号 |
22H05731
|
研究機関 | 九州工業大学 |
研究代表者 |
白井 一正 九州工業大学, 大学院情報工学研究院, 研究職員 (90816654)
|
研究期間 (年度) |
2022-06-16 – 2024-03-31
|
キーワード | 炭素固定能力 / 被子植物 / 機械学習 / ゲノム |
研究実績の概要 |
被子植物において、種ごとに著しく異なる炭素固定能力を、ゲノム情報から予測するモデルの構築を機械学習によって行なった。そこでまず、機械学習に使用する学習データの収集・構築を行なった。学習データとして、「炭素固定能力」と「全遺伝子ファミリー情報」を出来る限り多くの被子植物から収集した。先行研究として、炭素吸収能力の指標であるAssimilation rate per mass(Amass, 乾燥重量あたりの光合成速度)、Leaf Mass per Area(LMA, 葉面積あたり葉重、有機物の分解のしにくさの指標になる)を収集していた。今回の再収集により、Amassは92種から114種に、LMAは123種から155種にデータを拡張することに成功した。またこれらのデータはデータ計測時の生息環境などより厳しい基準を満たすものとなっている。 ゲノムデータについても、データベースから新たに再収集を行なった。その結果、136種から182種にデータを拡張することに成功した。しかし、これらのゲノムデータには、品質の悪いものがいくつか混入していた。そこで、ゲノムの品質が高いものを選抜した。 この結果、Amass 68種、LMA 89種の被子植物種の学習データを構築できた。 構築した学習データを使い、機械学習により、予測モデルの構築を行なった。機械学習の方法としては、Elastic Netを採用した。構築したモデルの精度を検証すると、AmassとLMA共に、非常に高い精度で予測できていることが示された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
サーバPCの故障により、モデルの構築の完了までに計画より時間を費やしたが、本研究の根幹である予測モデルの構築が完了したという点で順調であるといえる。
|
今後の研究の推進方策 |
今後は構築したモデルの検証を、さまざまな方法で実施する。その一つの方法として、ゲノム情報が明らかにされていないが、AmassとLMAが測定されている種を利用する。これらの種で、デジタルPCRなどの手法を用い、関連性の高い遺伝子のコピー数を定量し、モデルを使った予測を行うことで、その精度の検証を行う。
|