研究概要 |
1000を超えるような非常に多くの確率変数の依存関係を表すグラフィカルモデルの推定問題に対して,ベイジアンネットワーク,ブーリアンネットワーク,状態空間モデル,マルコフランダムフィールドなど様々なモデルを用いてその有効性について検討し学術雑誌および査読付きの国際会議にて論文発表した.これらの研究を通して,確率変数の数が増えるとともにモデルが観測データにオーバーフィットしていく様相を統計学的観点のみならず,実データの観点から再確認できた.この現象を克服するために同種の観測データの数を増やすことが困難な状況では他の実験系からのデータを統合することが必要不可欠である.この問題は,本研究のメインテーマであり,本年度はその着実な第一歩を踏み出せたと確信している.以下に本年度に行った研究の主なものをまとめる: [1]前年度行った超多次元データのクラスタリングのための混合因子分析モデルの推定を最尤法の枠組みからよりデータへの化適合を避けるために罰則付き最尤法に拡張した. [2]ブーリアンネットワークによる遺伝子ネットワーク推定においては,スコア関数の意味で同値なモデルが複数存在する可能性を示し,その解決策として発現データに加え結合配列データと呼ばれる別の実験系からの観測データを統合したスコア関数を提案した. [3]マイクロアレイデータに生物の進化情報を考慮することでマイクロアレイデータへの化適合を避けた遺伝子ネットワーク推定法を確立した. [4]薬剤を投与した際の時系列マイクロアレイデータと定常状態と思われるstaticなマイクロアレイデータを統合して薬剤の影響パスウェイを同定する手法を確立した. [5]ベイジアンネットワークとマルコフランダムフィールドを統合した新しいモデルを提案し,遺伝子制御のネットワークとタンパク質相互作用ネットワークを同時に推定する枠組みを提案した.
|