2003 Fiscal Year Annual Research Report
多重リサンプリングを用いたモデル信頼集合の構成法の開発とその応用
Project/Area Number |
14702061
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
下平 英寿 東京工業大学, 大学院・情報理工学研究科, 講師 (00290867)
|
Keywords | 統計的モデル選択 / 情報量規準 / モデル信頼集合 / 多重比較法 / 多重リサンプリング / マルチスケールブートストラップ / 統計的仮説検定 / バイオインフォマティクス |
Research Abstract |
確率モデルに基づいてデータから仮説を選択すること(統計的モデル選択)が広く行われている.本研究では特に多重リサンプリングという独自のアイデアを基礎に,多くの候補となるモデルについてその妥当性をデータに照らし合わせて定量的に評価し,それぞれのモデルについて確率値として表現する方法を開発している.非妥当性が有意に示されないモデルを選び出してきて列挙したものがモデル信頼集合であり,データから予想されるシナリオの一覧と解釈できる.本年度の具体的な成果はつぎのとおり. 1.マルチスケールブートストラップ法をさらに発展させたマルチステップ=マルチスケールブートストラップ法について,その統計的性質をEdgeworth展開とWeyl-tube法をもちいて詳しく調べた.昨年度までにこれを一部おこなっていたが,今年度は数学的証明のすべてのプロセスを数式処理ソフトウエア(MathematicaとMathTensor)を用いて再構築した.Three-step multiscale bootstrap法によって,指数型分布族の任意の分布関数において,漸近的に3次の不偏性をもつ確率値が計算できることが確認された. 2.マルチステップ=マルチスケールブートストラップ法を安定させて動作させるための工夫として,リッジ回帰法を導入することを提案した. 3.多重リサンプリング法の有効性をコンピュータシミュレーションによって数値的に一部確認した.またバイオインフォマティクス(分子進化系統樹分析,マイクロアレイ分析)に応用するためのソフトウエアの開発を継続した. 4.DNA配列データやマイクロアレイデータへ本手法を実際に応用し,その有効性も実証することができた.本年度は特に,クラスタコンピュータによって膨大な計算が必要になるような応用をおこなった.数十種の哺乳類の系統樹の推定と,遺伝子ネットワーク推定に,マルチスケールブートストラップ法を適用した.
|
Research Products
(3 results)
-
[Publications] 下平英寿: "データからの「発見」と新しいブートストラップ法"数理科学. 474. 14-20 (2002)
-
[Publications] T.Kamimuraほか: "Multiscale Bootstrap Analysis of Gene Networks Based on Bayesian Networks and Nonparametric Regression"Genome Informatics. 14. 350-351 (2003)
-
[Publications] T.Kanamori, H.Shimodaira: "Active learning algorithm using the maximum weighted log-likelihood estimator"Journal of Statistical Planning and Interface. 116. 149-162 (2003)