Research Abstract |
欠測値を含む多変量デ-タの解析法としては,スコアリング法とEMアルゴリズムが昔から有名であるが,これらの手法については,従来から種々の欠点が指摘されていた。特に,推定値が収束するまでの反復回数が多く,計算時間がかかりすぎることが実用上最大の欠点とされている。そこで本研究では,収束速度を改善することを最大の目標として,算法の提案と数値実験を行った。 EMアルゴリズムについては,ベクトルに対する1次変換の不動点を有限の計算量で求める“最小多項式外挿法"を導入し,欠測値のある多変量正規分布に対するEMアルゴリズムの加速に応用してみた。その結果,通常のEMアルゴリズムでは,反復回数が数十〜数百であったものが,数回〜十数回程度に改善された。加速を行うと,1反復あたりの計算時間は増すが,それでも全計算時間は1/10程度に短縮されることが判明した。 スコアリング法については,収束の次数が1次であることを実験的に確かめた。収束が遅い場合には,Aitkenの加速法を適用すると効果が大きいことも確かめられた。スコアリング法の他の欠点として,大域的収束性が無いことがあげられる。これに対する有効な対策は,現在のところ無いようである。そこで,反復の初期の段階では,大域的収束性のあるEMアルゴリズムを用い,途中からスコアリング法に乗り換えるのがよいであろうと思われる。
|