研究概要 |
確率モデルに基づいてデータから仮説を選択すること(統計的モデル選択)が広く行われている.本研究では特に多重リサンプリングという独自のアイデアを基礎に,多くの候補となるモデルについてその妥当性をデータに照らし合わせて定量的に評価し,それぞれのモデルについて確率値として表現する方法を開発している.非妥当性が有意に示されないモデルを選び出してきて列挙したものがモデル信頼集合であり,データから予想されるシナリオの一覧と解釈できる.本年度の具体的な成果はつぎのとおり. 1.マルチスケールブートストラップ法をさらに発展させたマルチステップ=マルチスケールブートストラップ法について,その統計的性質をEdgeworth展開とWeyl-tube法をもちいて詳しく調べた.昨年度までにThree-step multiscale bootstrap法によって,指数型分布族の任意の分布関数では漸近的に3次の不偏性をもつ確率値が計算できることが確認されたが,本年度は4次の不偏性を持つための条件が一部明らかになった. 2.多重リサンプリング法の有効性をコンピュータシミュレーションによって数値的に確認した.またバイオインフォマティクス(分子進化系統樹分析,マイクロアレイ分析)に応用するためのソフトウエアの開発をおこなった.このうち一部を新たに公開した. 3.DNA配列データやマイクロアレイデータへ本手法を実際に応用し,その有効性も実証することができた.クラスタコンピュータによって膨大な計算が必要になるような応用をおこない,数十種の哺乳類の系統樹の推定と,遺伝子ネットワーク推定に,マルチスケールブートストラップ法を適用した.系統樹推定では,MCMC法とブートストラップ法を併用する手法を提案し実装した.遺伝子ネットワーク推定では,GGM(グラフィカルガウシアンモデル)の構造推定とその信頼性評価を行った.
|