• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

EMアルゴリズムに代わる欠測データを用いたパラメータ推定法の開発

Research Project

Project/Area Number 18K11205
Research InstitutionKansai University

Principal Investigator

高井 啓二  関西大学, 商学部, 准教授 (20572019)

Project Period (FY) 2018-04-01 – 2021-03-31
Keywords欠測値 / EMアルゴリズム / フィッシャースコアリング / 加速法
Outline of Annual Research Achievements

データを収集すると,当初の計画通りに収集できず,一部が観測できないことがある.例えば,質問紙調査であれば回答拒否や,機械の調子が悪くなることによる記録ミスなどがある.このようなデータのことを欠測データと呼ぶ.欠測データの問題点は,完全に観測されたデータ(完全データ)を想定していた統計解析の手法が一切利用できなくなってしまうことである.そのため,統計モデルのパラメータ推測がスムーズにいかなくなってしまう.このような欠測データの問題に対して,EMアルゴリズムは1つの解決策であった.EMアルゴリズムによって,モデルのパラメータ推定が比較的容易に行えるようになった.しかしながら,EMアルゴリズムには,収束が遅い点,そして,収束に伴って推定量の分散の推定値が計算されないという点が問題点として指摘されてきた.こういった問題に対して,個別の解決策は講じられてきたが,どの方法も同時には解決できていなかった.本年度は,この2つの問題点を同時に解決する不完全データフィッシャースコアリング法(以降IFSと略)の論文を執筆し,査読付きの論文誌に採択された.この方法の利点は,収束を加速する式を用いると同時に,推定量の分散の推定値が計算できる点にある.論文では,加速法の数理的な性質,そして,収束することを証明している.このIFSはニュートンラフソン型の式で表されるが,そのステップ幅を適切に調節することによりEMアルゴリズムと一致することも示した.つまり,EMの持っている安定性などの好ましい性質は引き継ぎつつも,EMの欠点を克服しているハイブリッドな計算方法がIFSである.論文では,正規分布や,混合ポアソン,多変量t分布,ディリクレ分布のパラメータに対する適用も行い,従来のEMアルゴリズムやその改良法よりも早く収束することを理論上,数値上の両方で示した.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究の目的は,「欠測データに対するニュートン型の計算法を用いてEMアルゴリズムに代わる推定法(不完全データフィッシャースコアリング;IFS)を開発すること」であった.本年度は,このIFS法の定義・性質についての論文が査読付き論文誌に採択された.この論文は,本研究課題の核となる研究であるから,研究の最も重要な段階については達成できたと考える.この結果にもとづいて,昨年から行なっている「パラメータを分割したときの推定法」の開発も進んでいる.このパラメータ分割によるIFSについては,昨年度試みた探索的な因子分析への適用から,本年度は検証的な因子分析への適用を行っている.加えて,このIFSの数理的な性質についても現在研究中であり,いくつかの結果が得られている.一方で,昨年度行った欠測データにもとづく正規分布のパラメータ推定の結果を論文に投稿した結果,当該論文は残念ながらリジェクトされた.しかしながら,この研究はEMとIFSの関係性,EMの解釈についても説明を与えているだけでなく,新たな数理的な性質を与えている点で重要であると考えているため,今後も論文をリバイスし投稿を続ける予定である.以上のような理由から,おおむね順調に進展していると判断する.

Strategy for Future Research Activity

今後の研究方針は,本年度に論文として出版した不完全データフィッシャースコアリング(以下,IFSと略)について,適用範囲を拡大すること,および,理論的な性質を追求することである.まず適用範囲の拡大としては,因子分析と無限混合分布に対してIFSを適用する.これまでのIFSの適用対象は,正規分布,多変量t分布,ディリクレ分布であり,有限混合分布としては2つのポアソン分布の混合分布であった.理論的には,IFSは一般的な分布であれば何にでも適用できるはずだが,他の分布については適用されてこなかった.そこで,今後は欠測データと同様の扱いできる潜在変数についてのモデルのうち,もっとも代表的なモデルである因子分析モデルに対してIFSを適用する.さらに,マーケティングで重要な役割を担う無限混合分布に対しても同様にIFSを適用する.無限混合分布は,潜在変数のモデルと捉えることもできるので,IFSの適用は自然であろう.

IFSの適用範囲の拡大に加えて,IFSの理論的な性質の追求も行う.1つ目の目的は, IFSの加速の限界を示すことである.IFSはステップ幅の調整を通じて,収束のスピードを加速し,超1次収束が達成できた.そこで疑問となるのは,同様の加速法を用いると更に加速できるのか否かである.数値解析の理論を用いて,IFSの加速の限界を探ることを計画している.もう1つの目的は,IFSによって生み出される推定量の列の漸近的な性質を探ることである.ニュートンラフソン法は,一度使うだけで一致推定量の漸近分散を小さくすることが知られているが,欠測データに対するIFSは推定量の性質をどの程度改善するかは知られていない.もしその性質がわかれば,IFSが単に数値計算の手段としてだけでなく,理論的な側面においても重要な道具立てとなることから,漸近的な性質は興味深い.

Causes of Carryover

予定との差額が大きい理由は,ジャーナルのオープンアクセスの費用の執行(およそ30万円)が遅れているためである.それ以外の差額については,研究の進捗が遅く,予定通り海外の学会などで発表できず,旅費分が浮いていることによる.今後の計画としては,まず論文の英文校閲,およびオープンアクセスの費用に使用する予定である.状況が許せば,海外での発表なども試みる.

  • Research Products

    (2 results)

All 2020 2019

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (1 results)

  • [Journal Article] Incomplete-data Fisher scoring method with steplength adjustment (article) Author2020

    • Author(s)
      Keiji Takai
    • Journal Title

      Statistics and Computing

      Volume: 30 Pages: 871-886

    • DOI

      https://doi.org/10.1007/s11222-020-09923-z

    • Peer Reviewed / Open Access
  • [Presentation] 欠測データを用いたフィッシャースコアリング法2019

    • Author(s)
      高井啓二
    • Organizer
      科 研費シンポジウム「高次元複雑データの統計モデリング」

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi