Development of prediction model for species specific potential of carbon fixation based on angiosperm genomes
Publicly Offered Research
Project Area | Digital biosphere: integrated biospheric science for mitigating global environment change |
Project/Area Number |
22H05731
|
Research Category |
Grant-in-Aid for Transformative Research Areas (A)
|
Allocation Type | Single-year Grants |
Review Section |
Transformative Research Areas, Section (IV)
|
Research Institution | Kyushu Institute of Technology |
Principal Investigator |
白井 一正 九州工業大学, 大学院情報工学研究院, 研究職員 (90816654)
|
Project Period (FY) |
2022-06-16 – 2024-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥9,620,000 (Direct Cost: ¥7,400,000、Indirect Cost: ¥2,220,000)
Fiscal Year 2023: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
Fiscal Year 2022: ¥4,810,000 (Direct Cost: ¥3,700,000、Indirect Cost: ¥1,110,000)
|
Keywords | 遺伝子ファミリー / 炭素固定能力 / 被子植物 / 機械学習 / ゲノム |
Outline of Research at the Start |
植物は、大気中の二酸化炭素を固定する能力を持つ、地球環境を改善する能力を持つ生命体である。地球温暖化を緩和し、地球環境を安定化するためには、植物の光合成活動を活発化させ、分解されにくい有機物を植物に作らせる炭素固定能力を地球規模で向上させることが重要になる。しかし、植物種によって著しく異なる炭素固定能力の把握はこれまで困難であった。そこで、本研究では、陸上植物の90%を占める被子植物において、種ごとに異なる炭素固定能力を、遺伝情報であるゲノムから予測するモデルの構築を行い、その有用性を複数の方法で検証する。
|
Outline of Annual Research Achievements |
被子植物において、種ごとに著しく異なる炭素固定能力を、ゲノム情報から予測するモデルの構築を機械学習によって行なった。そこでまず、機械学習に使用する学習データの収集・構築を行なった。学習データとして、「炭素固定能力」と「全遺伝子ファミリー情報」を出来る限り多くの被子植物から収集した。先行研究として、炭素吸収能力の指標であるAssimilation rate per mass(Amass, 乾燥重量あたりの光合成速度)、Leaf Mass per Area(LMA, 葉面積あたり葉重、有機物の分解のしにくさの指標になる)を収集していた。今回の再収集により、Amassは92種から114種に、LMAは123種から155種にデータを拡張することに成功した。またこれらのデータはデータ計測時の生息環境などより厳しい基準を満たすものとなっている。 ゲノムデータについても、データベースから新たに再収集を行なった。その結果、136種から182種にデータを拡張することに成功した。しかし、これらのゲノムデータには、品質の悪いものがいくつか混入していた。そこで、ゲノムの品質が高いものを選抜した。 この結果、Amass 68種、LMA 89種の被子植物種の学習データを構築できた。 構築した学習データを使い、機械学習により、予測モデルの構築を行なった。機械学習の方法としては、Elastic Netを採用した。構築したモデルの精度を検証すると、AmassとLMA共に、非常に高い精度で予測できていることが示された。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
サーバPCの故障により、モデルの構築の完了までに計画より時間を費やしたが、本研究の根幹である予測モデルの構築が完了したという点で順調であるといえる。
|
Strategy for Future Research Activity |
今後は構築したモデルの検証を、さまざまな方法で実施する。その一つの方法として、ゲノム情報が明らかにされていないが、AmassとLMAが測定されている種を利用する。これらの種で、デジタルPCRなどの手法を用い、関連性の高い遺伝子のコピー数を定量し、モデルを使った予測を行うことで、その精度の検証を行う。
|
Report
(1 results)
Research Products
(1 results)