2002 Fiscal Year Annual Research Report
多重リサンプリングを用いたモデル信頼集合の構成法の開発とその応用
Project/Area Number |
14702061
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
下平 英寿 東京工業大学, 大学院・情報理工学研究科, 講師 (00290867)
|
Keywords | 統計的モデル選択 / 情報量規準 / モデル信頼集合 / 多重比較法 / 多重リサンプリング / マルチスケールブートストラップ / 統計的仮説検定 / バイオインフォマティクス |
Research Abstract |
確率モデルに基づいてデータから仮説を選択すること(統計的モデル選択)が広く行われている.本研究では特に多重リサンプリングという独自のアイデアを基礎に,多くの候補となるモデルについてその妥当性をデータに照らし合わせて定量的に評価し,それぞれのモデルについて確率値として表現する方法を開発している.非妥当性が有意に示されないモデルを選び出してきて列挙したものがモデル信頼集合であり,データから予想されるシナリオの一覧と解釈できる.本年度の具体的な成果はつぎのとおり. 1.多重リサンプリングによる確率値の計算の数理統計的な性質を,漸近展開の一種であるEdgeworth展開の手法を用いて明らかにした.数式変形が非常に複雑になることから数式処理ソフト(Mathematica)を用いた.結果として,多重リサンプリングの基本形として本研究で提案しているマルチスケールブートストラップ法が漸近的に3次の不偏性をもつ条件が明らかになった. 2.マルチスケールブートストラップ法より一般的な条件で機能する多重リサンプリング法としてマルチステップ=マルチスケールブートストラップ法のアイデアを新たに得て,この数理統計的な性質をEdgeworth展開の手法で明らかにした. 3.多重リサンプリング法の有効性をコンピュータシミュレーションによって数値的に一部確認した.本年度導入したクラスタコンピュータでも利用できる予備的なソフトウエアを作成した.また一部機能を特にバイオインフォマティクス(分子進化系統樹分析,マイクロアレイ分析)に応用するためのソフトウエアの開発を継続し,一般に公開した. 4.統計数理研究所や東大医科学研究所などとの研究協力により,DNA配列データやマイクロアレイデータへ本手法を実際に応用し,その有効性も実証することができた.
|
Research Products
(3 results)
-
[Publications] H.Shimodaira: "Approximately unbiased test of phylogenetic tree selection"Systematic Biology. 51. 492-508 (2002)
-
[Publications] 下平英寿: "ブートストラップ法によるクラスタ分析のバラツキ評価"統計数理. 50. 33-44 (2002)
-
[Publications] S.Imoto, S.Kim, H.Shimodaira, S.Aburatani, K.Tashiro, S.Kuhara, S.Miyano: "Bootstrap Analysis of Gene Networks Based on Bayesian Networks and Nonparamatric Regression"Genome Informatics. 13. 369-370 (2002)