研究実績の概要 |
分割の確率モデルはノンパラメトリック・ベイズ統計などを通してデータ解析の基礎になります。基本であるDirichlet過程を例として説明します。サイズの分布はPoisson-Dirichlet分布と呼ばれ、ある測度値拡散過程の定常分布です。逐次抽出は中華料理店過程と呼ばれます。得られる標本は分割の確率過程の定常分布です。様々な数学的な問題に関わりますが、主に確率論の枠組みで議論されていて、データ解析の視点が不足していると考えています。本課題では、確率論と代数的枠組みの融合を手がかりに、モデルの探求と計算機を援用したデータ解析の方法の提案を目指してきました。30年度は本課題の最終年度で、これまで得られた成果を含めた内容をモノグラフの形で出版しました(Partitions, Hypergeometric Systems, and Dirichlet Processes in Statistics, Springer)。本書籍は5章からなり、5章がデータ解析の方法論に関する新規性の高い内容ですが、その一つのハイライトが昨年度見出した任意のトーリックモデル(離散データの統計モデルのクラスでグラフィカルモデルを含む)やランダムヤング図形からの直接抽出のアルゴリズムです。このアルゴリズムはセル(変数の組み合わせ)の期待値を計算することを繰り返しますが、その期待値がGelfandらにより定義されたA超幾何多項式になります。その効率的な評価について計算代数の観点から高山信毅氏と検討しました。
|