研究概要 |
確率モデルに基づいてデータから仮説を選択すること(統計的モデル選択)が広く行われている.本研究では特に多重リサンプリングという独自のアイデアを基礎に,多くの候補となるモデルについてその妥当性をデータに照らし合わせて定量的に評価し,それぞれのモデルについて確率値として表現する方法を開発している.非妥当性が有意に示されないモデルを選び出してきて列挙したものがモデル信頼集合であり,データから予想されるシナリオの一覧と解釈できる.本年度の具体的な成果はつぎのとおり. 1.マルチスケールブートストラップ法をさらに発展させたマルチステップ=マルチスケールブートストラップ法について,その統計的性質をEdgeworth展開とWeyl-tube法をもちいて詳しく調べた.昨年度までにこれを一部おこなっていたが,今年度は数学的証明のすべてのプロセスを数式処理ソフトウエア(MathematicaとMathTensor)を用いて再構築した.Three-step multiscale bootstrap法によって,指数型分布族の任意の分布関数において,漸近的に3次の不偏性をもつ確率値が計算できることが確認された. 2.マルチステップ=マルチスケールブートストラップ法を安定させて動作させるための工夫として,リッジ回帰法を導入することを提案した. 3.多重リサンプリング法の有効性をコンピュータシミュレーションによって数値的に一部確認した.またバイオインフォマティクス(分子進化系統樹分析,マイクロアレイ分析)に応用するためのソフトウエアの開発を継続した. 4.DNA配列データやマイクロアレイデータへ本手法を実際に応用し,その有効性も実証することができた.本年度は特に,クラスタコンピュータによって膨大な計算が必要になるような応用をおこなった.数十種の哺乳類の系統樹の推定と,遺伝子ネットワーク推定に,マルチスケールブートストラップ法を適用した.
|