2000 Fiscal Year Annual Research Report
分類問題における混合分布モデルの研究-群数推定・数値的処理・ソフトウェアの実装-
Project/Area Number |
11780173
|
Research Institution | Sapporo Gakuin University |
Principal Investigator |
中村 永友 札幌学院大学, 経済学部, 助教授 (70207900)
|
Keywords | 混合分布モデル / EMアルゴリズム / 情報量規準 / 成分数推定 / ブートストラップ / EIC / CEIC |
Research Abstract |
本研究は,(1)分類手法としての「混合分布モデル」において「いくつの群で分類すればもっともらしいか」という本質的問題,(2)モデルのパラメータ推定に関する数値計算上の問題,(3)このモデルによるデータ分類のためのソフトウェア開発及びその公開である.これらの問題に対して2年間で行ったことは以下の通りである.(1)に関しては,(一般化)情報量規準に基づき混合分布モデルのコンポーネント数の推定を行うことで,多変量データの場合はその有効性が確かめられた.一方1変量の場合に情報量規準EIC・CEIC(ブートストラップ・バイアス推定による情報量規準)のバイアス近似が必ずしもうまくいかない場合がシミュレーション研究で生じてたが,これも十分なバイアス補正が出来ることがわかってきた.(2)に関しては,モデルのパラメータの最尤推定におけるEM法の遅い収束が問題で,この理論的・数値計算上の問題に対して考察とプログラムの改良を行なってきた.(3)は国内外にこのモデルによる分類が出来るソフトウェアがほとんどないので,現時点での最良のソフトウェアを整備し,web上での公開やS(データ解析ソフトウェア)の関数として公開準備をしている. 平成11年度は人工衛星により観測されたプラズマ粒子速度データに対して混合分布モデル(多変量正規分布と多変量t分布)の適用を行い,成分数の推定と実用ソフトウェアの開発を行った.平成12年度はこのデータ解析の継続と混合分布モデルのパラメータ推定の一般的問題に対する考察を進め,同時に開発したプログラムの高速化と公開のための改良と整備を行った.混合分布モデルにおけるEM法自身の問題に関しては,遅い収束と推定値が必ずしも大域的最適解でないことが最大の難点で,すぐに解決できる問題ではないことがわかってきた.現在の結論は,各データセットにはそれぞれの特徴があるので,固有の修正パラメータ推定法を考案して,各問題を解決するしかないということである.一般的方法論の構築に向けて今後もこの周辺問題を取り上げていく.
|
Research Products
(1 results)