2022 Fiscal Year Annual Research Report
Development of prediction model for species specific potential of carbon fixation based on angiosperm genomes
Publicly Offered Research
Project Area | Digital biosphere: integrated biospheric science for mitigating global environment change |
Project/Area Number |
22H05731
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
白井 一正 九州工業大学, 大学院情報工学研究院, 研究職員 (90816654)
|
Project Period (FY) |
2022-06-16 – 2024-03-31
|
Keywords | 炭素固定能力 / 被子植物 / 機械学習 / ゲノム |
Outline of Annual Research Achievements |
被子植物において、種ごとに著しく異なる炭素固定能力を、ゲノム情報から予測するモデルの構築を機械学習によって行なった。そこでまず、機械学習に使用する学習データの収集・構築を行なった。学習データとして、「炭素固定能力」と「全遺伝子ファミリー情報」を出来る限り多くの被子植物から収集した。先行研究として、炭素吸収能力の指標であるAssimilation rate per mass(Amass, 乾燥重量あたりの光合成速度)、Leaf Mass per Area(LMA, 葉面積あたり葉重、有機物の分解のしにくさの指標になる)を収集していた。今回の再収集により、Amassは92種から114種に、LMAは123種から155種にデータを拡張することに成功した。またこれらのデータはデータ計測時の生息環境などより厳しい基準を満たすものとなっている。 ゲノムデータについても、データベースから新たに再収集を行なった。その結果、136種から182種にデータを拡張することに成功した。しかし、これらのゲノムデータには、品質の悪いものがいくつか混入していた。そこで、ゲノムの品質が高いものを選抜した。 この結果、Amass 68種、LMA 89種の被子植物種の学習データを構築できた。 構築した学習データを使い、機械学習により、予測モデルの構築を行なった。機械学習の方法としては、Elastic Netを採用した。構築したモデルの精度を検証すると、AmassとLMA共に、非常に高い精度で予測できていることが示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
サーバPCの故障により、モデルの構築の完了までに計画より時間を費やしたが、本研究の根幹である予測モデルの構築が完了したという点で順調であるといえる。
|
Strategy for Future Research Activity |
今後は構築したモデルの検証を、さまざまな方法で実施する。その一つの方法として、ゲノム情報が明らかにされていないが、AmassとLMAが測定されている種を利用する。これらの種で、デジタルPCRなどの手法を用い、関連性の高い遺伝子のコピー数を定量し、モデルを使った予測を行うことで、その精度の検証を行う。
|
Research Products
(1 results)