研究課題/領域番号 |
18K11205
|
研究機関 | 関西大学 |
研究代表者 |
高井 啓二 関西大学, 商学部, 准教授 (20572019)
|
研究期間 (年度) |
2018-04-01 – 2021-03-31
|
キーワード | 欠測値 / EMアルゴリズム / フィッシャースコアリング / 加速法 |
研究実績の概要 |
データを収集すると,当初の計画通りに収集できず,一部が観測できないことがある.例えば,質問紙調査であれば回答拒否や,機械の調子が悪くなることによる記録ミスなどがある.このようなデータのことを欠測データと呼ぶ.欠測データの問題点は,完全に観測されたデータ(完全データ)を想定していた統計解析の手法が一切利用できなくなってしまうことである.そのため,統計モデルのパラメータ推測がスムーズにいかなくなってしまう.このような欠測データの問題に対して,EMアルゴリズムは1つの解決策であった.EMアルゴリズムによって,モデルのパラメータ推定が比較的容易に行えるようになった.しかしながら,EMアルゴリズムには,収束が遅い点,そして,収束に伴って推定量の分散の推定値が計算されないという点が問題点として指摘されてきた.こういった問題に対して,個別の解決策は講じられてきたが,どの方法も同時には解決できていなかった.本年度は,この2つの問題点を同時に解決する不完全データフィッシャースコアリング法(以降IFSと略)の論文を執筆し,査読付きの論文誌に採択された.この方法の利点は,収束を加速する式を用いると同時に,推定量の分散の推定値が計算できる点にある.論文では,加速法の数理的な性質,そして,収束することを証明している.このIFSはニュートンラフソン型の式で表されるが,そのステップ幅を適切に調節することによりEMアルゴリズムと一致することも示した.つまり,EMの持っている安定性などの好ましい性質は引き継ぎつつも,EMの欠点を克服しているハイブリッドな計算方法がIFSである.論文では,正規分布や,混合ポアソン,多変量t分布,ディリクレ分布のパラメータに対する適用も行い,従来のEMアルゴリズムやその改良法よりも早く収束することを理論上,数値上の両方で示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究の目的は,「欠測データに対するニュートン型の計算法を用いてEMアルゴリズムに代わる推定法(不完全データフィッシャースコアリング;IFS)を開発すること」であった.本年度は,このIFS法の定義・性質についての論文が査読付き論文誌に採択された.この論文は,本研究課題の核となる研究であるから,研究の最も重要な段階については達成できたと考える.この結果にもとづいて,昨年から行なっている「パラメータを分割したときの推定法」の開発も進んでいる.このパラメータ分割によるIFSについては,昨年度試みた探索的な因子分析への適用から,本年度は検証的な因子分析への適用を行っている.加えて,このIFSの数理的な性質についても現在研究中であり,いくつかの結果が得られている.一方で,昨年度行った欠測データにもとづく正規分布のパラメータ推定の結果を論文に投稿した結果,当該論文は残念ながらリジェクトされた.しかしながら,この研究はEMとIFSの関係性,EMの解釈についても説明を与えているだけでなく,新たな数理的な性質を与えている点で重要であると考えているため,今後も論文をリバイスし投稿を続ける予定である.以上のような理由から,おおむね順調に進展していると判断する.
|
今後の研究の推進方策 |
今後の研究方針は,本年度に論文として出版した不完全データフィッシャースコアリング(以下,IFSと略)について,適用範囲を拡大すること,および,理論的な性質を追求することである.まず適用範囲の拡大としては,因子分析と無限混合分布に対してIFSを適用する.これまでのIFSの適用対象は,正規分布,多変量t分布,ディリクレ分布であり,有限混合分布としては2つのポアソン分布の混合分布であった.理論的には,IFSは一般的な分布であれば何にでも適用できるはずだが,他の分布については適用されてこなかった.そこで,今後は欠測データと同様の扱いできる潜在変数についてのモデルのうち,もっとも代表的なモデルである因子分析モデルに対してIFSを適用する.さらに,マーケティングで重要な役割を担う無限混合分布に対しても同様にIFSを適用する.無限混合分布は,潜在変数のモデルと捉えることもできるので,IFSの適用は自然であろう.
IFSの適用範囲の拡大に加えて,IFSの理論的な性質の追求も行う.1つ目の目的は, IFSの加速の限界を示すことである.IFSはステップ幅の調整を通じて,収束のスピードを加速し,超1次収束が達成できた.そこで疑問となるのは,同様の加速法を用いると更に加速できるのか否かである.数値解析の理論を用いて,IFSの加速の限界を探ることを計画している.もう1つの目的は,IFSによって生み出される推定量の列の漸近的な性質を探ることである.ニュートンラフソン法は,一度使うだけで一致推定量の漸近分散を小さくすることが知られているが,欠測データに対するIFSは推定量の性質をどの程度改善するかは知られていない.もしその性質がわかれば,IFSが単に数値計算の手段としてだけでなく,理論的な側面においても重要な道具立てとなることから,漸近的な性質は興味深い.
|
次年度使用額が生じた理由 |
予定との差額が大きい理由は,ジャーナルのオープンアクセスの費用の執行(およそ30万円)が遅れているためである.それ以外の差額については,研究の進捗が遅く,予定通り海外の学会などで発表できず,旅費分が浮いていることによる.今後の計画としては,まず論文の英文校閲,およびオープンアクセスの費用に使用する予定である.状況が許せば,海外での発表なども試みる.
|