Research Abstract |
本研究では,様々なゲノム情報から,タンパク質間の機能ネットワークを予測する手法を開発した.カーネル正準相関分析を用いて,ゲノムデータとタンパク質ネットワークの相関モデルを構築し,新規のタンパク質間ネットワークを予測する方法を提案した.この方法の独自性は,教師付き学習の枠組においてネットワーク推定を行なう点にある.まず,第一段階として,ネットワークが既知のタンパク質セットから,ゲノムデータとパスウェイの相関(ネットワーク構築原理)を,数学的に学習させモデルを構築する.第二段階として,そのモデルを,ネットワークの分かっていないタンパク質セットに当てはめ,ネットワークを予測する.実際の適用例として,出芽酵母のタンパク質間の機能ネットワークを,マイクロアレイ遺伝子発現情報,酵母2ハイブリッドシステムによる相互作用情報,タンパク質の細胞内局在情報,系統プロファイルの4種類のデータから予測した.実験によって判明している既知のタンパク質ネットワークを用いて評価した結果,本研究で提案する複数のデータの統合と教師付き学習の効果によって,先行研究の方法(教師なし学習)よりも予測精度が著しく向上することが確認できた.そこで,全てのタンパク質セットに対して提案手法を適用し,出芽酵母の6059個のタンパク質からなる機能的ネットワークを推定した.それを基に,未知のタンパク質の機能や,missing酵素の遺伝子候補を予測し,その妥当性について検討し,この手法が新しい生物学的な発見に繋がる可能性について議論した.
|