本研究では、統合ディファレンシャルネットワーク情報を利活用した植物遺伝子機能予測のための統合的学習アルゴリズムの開発を行った。そのコア技術として、発現差異 [Differentially Expressed Genes (DEGs)]、ディファレンシャル共発現 (Differential Co-expression) および転写因子情報を組み合わせたDifferential Regulatory Analysis (DRA)と呼ばれるアプローチを採用した。客観的かつ持続可能な遺伝子機能予測の性能評価のために、gold standardとしてネットワークオントロジーの利活用を試みた。さらに予測機能向上のため、アンサンブル学習により複数DRAを統合する。本アプローチのベースとなるアンサンブル学習は、個々の機械学習によるアプローチよりも性能が良くなることが期待できる。データ解析自動化と再利用性の向上のため、複数DRA手法のRパッケージ実装を進め、GitHub (https://github.com/afukushima/) で公開した。遺伝子間の機能的関連性を定量化し、機能予測を行うネットワークモデル構築法の確立に向けた着実な歩みを続けた。植物が持つ環境への適応力や多種多様な代謝物の生合成能力の背後にある制御ネットワーク解明へ向け、未解明の遺伝子制御ネットワーク同定法の確立が望まれる。本研究で開発を進めたアプローチの利活用は作物種へのストレス耐性付与等の有用形質獲得に寄与する。
|