研究概要 |
確率モデルに基づいてデータから仮説を選択すること(統計的モデル選択)が広く行われている.本研究では特に多重リサンプリングという独自のアイデアを基礎に,多くの候補となるモデルについてその妥当性をデータに照らし合わせて定量的に評価し,それぞれのモデルについて確率値として表現する方法を開発している.非妥当性が有意に示されないモデルを選び出してきて列挙したものがモデル信頼集合であり,データから予想されるシナリオの一覧と解釈できる.本年度の具体的な成果はつぎのとおり. 1.多重リサンプリングによる確率値の計算の数理統計的な性質を,漸近展開の一種であるEdgeworth展開の手法を用いて明らかにした.数式変形が非常に複雑になることから数式処理ソフト(Mathematica)を用いた.結果として,多重リサンプリングの基本形として本研究で提案しているマルチスケールブートストラップ法が漸近的に3次の不偏性をもつ条件が明らかになった. 2.マルチスケールブートストラップ法より一般的な条件で機能する多重リサンプリング法としてマルチステップ=マルチスケールブートストラップ法のアイデアを新たに得て,この数理統計的な性質をEdgeworth展開の手法で明らかにした. 3.多重リサンプリング法の有効性をコンピュータシミュレーションによって数値的に一部確認した.本年度導入したクラスタコンピュータでも利用できる予備的なソフトウエアを作成した.また一部機能を特にバイオインフォマティクス(分子進化系統樹分析,マイクロアレイ分析)に応用するためのソフトウエアの開発を継続し,一般に公開した. 4.統計数理研究所や東大医科学研究所などとの研究協力により,DNA配列データやマイクロアレイデータへ本手法を実際に応用し,その有効性も実証することができた.
|