研究課題/領域番号 |
20K06043
|
研究機関 | 国立研究開発法人理化学研究所 |
研究代表者 |
福島 敦史 国立研究開発法人理化学研究所, 環境資源科学研究センター, 上級研究員 (80415281)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | バイオインフォマティクス / トランスクリプトーム / 共発現ネットワーク解析 / データ統合 / 機械学習 |
研究実績の概要 |
高速かつ網羅的な分析技術が発展するに伴い、さらなるバイオインフォマティクスと生物統計の手法開発が必須である。本研究では、統合ディファレンシャルネットワーク情報を利活用した客観的かつ持続的な遺伝子機能予測手法の開発を目的とした。 そのコア技術は、発現差異 (DEGs)、とディファレンシャル共発現 (DC) および転写因子情報を組み合わせたDifferential Regulatory Analysis (DRAと総称) である。客観的かつ持続可能な遺伝子機能予測の性能評価のために、自動構築するネットワークオントロジーをgold standardとして利活用する。さらなる予測機能向上のために、アンサンブル機械学習により複数DRAを統合する。最終的に、遺伝子間の機能的関連性を定量化し、予測するためのネットワークモデル構築法を確立する。開発した統計的評価法パイプラインは作物種ストレスデータへと応用し、その結果のオープンデータ化を進める。ストレス耐性付与等の有用形質獲得に寄与しうる未解明の遺伝子制御ネットワーク同定は、最終的にバイオ技術イノベーションから社会還元への道筋に多様性を与える。 以上の計画に従い、本年度は主なDRA手法のRパッケージ実装を進めた (解析自動化と再利用性の向上)。DRAアプローチは複数亜種があり、これらを情報統合することが有用と考えられる。一般的にアンサンブル学習は、各機械学習によるアプローチよりも性能が良くなることが期待される。本研究は、植物が持つ環境への適応力や多種多様な代謝物の生合成能力の背後にある制御ネットワーク解明への新機軸を打ち出す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
主なDRA手法のRパッケージ実装を進める過程で、海外機関(大学)との国際共同研究の強化がなされ、概ね順調な進み具合である。
|
今後の研究の推進方策 |
引き続き周辺研究分野で開発されているデータマイニング手法に注視しつつ、植物遺伝子機能予測のための統合的学習アルゴリズムの開発と応用研究を進める。研究計画の大幅な変更はない。
|