研究実績の概要 |
分割の確率モデルはノンパラメトリック・ベイズ統計などを通してデータ解析の基礎になります.基本であるDirichlet過程を例として説明します.サイズの分布はPoisson-Dirichlet分布と呼ばれ,ある測度値拡散過程の定常分布です.逐次抽出は中華料理店過程と呼ばれます.得られる標本は分割の確率過程の定常分布です.様々な数学的な問題に関わりますが,主に確率論の枠組みで議論されていて,データ解析の視点が不足していると考えています.本課題では,確率論と代数的枠組みの融合を手がかりに,モデルの探求と計算機を援用したデータ解析の方法の提案を目指しています.29年度は,特にデータ解析の方法に関わる成果を得ました.サンプラーは,相似検定や事後分布からの抽出など,データ解析の多くの局面で欠かせません.正規化定数の計算が現実的でない問題についてはマルコフ連鎖モンテカルロ法(MCMC)を用いるのが標準的です.しかし,MCMCには,定常分布に達していることを保証することが難しいこと,自己相関の存在など,原理的に避けられない欠点があるので,正規化定数の計算が可能であれば,直接抽出する方が望ましいです.本研究では,計数データの標準的なモデルである対数アフィンモデルから交換可能な標本を抽出して得られる分布を十分統計量で条件付けて得られる分布について,正規化定数を数え上げの計算を避けて計算することで,直接抽出のアルゴリズムを導出しました.それが可能な理由は,上記の分布の規格化定数はGel'fandらにより定義されたA超幾何多項式になりますが,それらの超幾何函数として漸化式を組み合わせて用いることで数え上げを避けられるからです.差分holonomic勾配法と呼ばれる数値計算法の例になっています.
|