2020 Fiscal Year Research-status Report
植物遺伝子機能予測のための統合的学習アルゴリズムの開発と応用
Project/Area Number |
20K06043
|
Research Institution | Institute of Physical and Chemical Research |
Principal Investigator |
福島 敦史 国立研究開発法人理化学研究所, 環境資源科学研究センター, 上級研究員 (80415281)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Keywords | バイオインフォマティクス / トランスクリプトーム / 共発現ネットワーク解析 / データ統合 / 機械学習 |
Outline of Annual Research Achievements |
高速かつ網羅的な分析技術が発展するに伴い、さらなるバイオインフォマティクスと生物統計の手法開発が必須である。本研究では、統合ディファレンシャルネットワーク情報を利活用した客観的かつ持続的な遺伝子機能予測手法の開発を目的とした。 そのコア技術は、発現差異 (DEGs)、とディファレンシャル共発現 (DC) および転写因子情報を組み合わせたDifferential Regulatory Analysis (DRAと総称) である。客観的かつ持続可能な遺伝子機能予測の性能評価のために、自動構築するネットワークオントロジーをgold standardとして利活用する。さらなる予測機能向上のために、アンサンブル機械学習により複数DRAを統合する。最終的に、遺伝子間の機能的関連性を定量化し、予測するためのネットワークモデル構築法を確立する。開発した統計的評価法パイプラインは作物種ストレスデータへと応用し、その結果のオープンデータ化を進める。ストレス耐性付与等の有用形質獲得に寄与しうる未解明の遺伝子制御ネットワーク同定は、最終的にバイオ技術イノベーションから社会還元への道筋に多様性を与える。 以上の計画に従い、本年度は主なDRA手法のRパッケージ実装を進めた (解析自動化と再利用性の向上)。DRAアプローチは複数亜種があり、これらを情報統合することが有用と考えられる。一般的にアンサンブル学習は、各機械学習によるアプローチよりも性能が良くなることが期待される。本研究は、植物が持つ環境への適応力や多種多様な代謝物の生合成能力の背後にある制御ネットワーク解明への新機軸を打ち出す。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
主なDRA手法のRパッケージ実装を進める過程で、海外機関(大学)との国際共同研究の強化がなされ、概ね順調な進み具合である。
|
Strategy for Future Research Activity |
引き続き周辺研究分野で開発されているデータマイニング手法に注視しつつ、植物遺伝子機能予測のための統合的学習アルゴリズムの開発と応用研究を進める。研究計画の大幅な変更はない。
|