2016 Fiscal Year Research-status Report
欠測データ解析における新しい無視可能条件の構築と推定量の分布の研究
Project/Area Number |
26730022
|
Research Institution | Kansai University |
Principal Investigator |
高井 啓二 関西大学, 商学部, 准教授 (20572019)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | 欠測データ / MAR / 不完全データ / 数値計算 / 独立性 |
Outline of Annual Research Achievements |
本年度は,欠測データにもとづくモデルのパラメータの計算方法についての研究を行った.全てのデータが観測されていると容易に計算できる平均でさえも,欠測データがあると計算が急激に難しくなってしまう.パラメータの計算を簡単にするため,以下の二つの研究を行った. 第一に,正規分布におけるパラメータの計算方法である.正規分布は,完全データに対しても,欠測データに対しても,非常に基本的な分布である.しかし,欠測データの場合には,パラメータの計算には多大の労力が必要となる.特定の欠測パターンにおいてのみ,パラメータが明示的に計算できることがわかっている.実際には,どのようなパターンであっても計算できる方法が必要である.本研究では,正規分布に限定し,新たなパラメータの計算方法を提唱した.この方法は,従来の計算方法(例えば,EMアルゴリズム)を改良するための様々な示唆を含んでいた.本研究の結果は,査読のある論文誌に投稿中である. 第二に,上の結果をもとに,欠測データを含む全ての分布のパラメータ計算にも対処できる計算方法として不完全データによるフィッシャースコアリング法を開発し,その収束の性質を調べた.ここで,不完全データという言葉を使っているのは,この方法が欠測データだけでなく,潜在変数モデルのパラメータ推定にも利用可能であることを示すためである.欠測データに対する標準的計算方法であるEMアルゴリズムの利点は,その計算が単純であること,そして安定的であることである.一方,その問題点としては,収束が遅いこと,パラメータの標準誤差が得られないことである.本研究で開発した方法は, EMアルゴリズムよりも単純で安定的であるが,収束が早く,更にパラメータの標準誤差を計算することができる.本研究の結果は,査読のある学術雑誌に投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本申請研究の目的の一つは「(欠測データの)”無視可能”条件の再構築」であった.これまでに,無視可能条件よりも弱い条件である「ランダムな欠測」(以下,MAR)と同等の条件を導出し,その理論的な性質や利用可能性について研究してきた.研究目的であった変数との独立性の観点から,MARとの同値条件を導くことができただけでなく,当初の研究目的を超えてグラフィカルモデルとの関連についても調べることができた. 本申請研究のもう一つの目的は「最尤推定量と最尤推定法以外による推定量の漸近的な分布の導出」であった.ここで言う推定量とは,ある方程式を解いた時の解を確率変数と見なしたもののことである.これは,理論上の存在であり,その当該方程式が実際に解けるかどうかは問題ではない.しかし,実際の応用においてはその方程式を解いて推定量の実現値(推定値と言う)を求めなければならない.つまり,現実に欠測データの解析を行うためには,方程式を解くための計算方法が必要である.そういった計算方法によって,理論上の存在である推定量の性質も明らかになるので,計算方法を研究することは研究上の目的にかなっている.これまで計算方法として,フィッシャースコアリング法を用いた推定法を提案した.これは,従来の計算方法であるEMアルゴリズムの持つ問題を潜在的にはすべて解決することができる方法である.最尤法に限らず,他の推定方法による推定量の分布を調べることにも利用できる方法である.本年度は,在外研究を開始し,研究時間の確保が困難となったこともあり,推定量の分布の導出までは至ることができなかったため,以上のような区分とした.
|
Strategy for Future Research Activity |
本年度は,「最尤推定量と最尤推定法以外による推定量の漸近的な分布の導出」について研究を進める.上で述べたように,前年度は不完全データのためのフィッシャースコアリング法(以降,FS法)を開発した.これまでの論文では,確率分布モデルの最尤推定値を出す方法としてFS法を扱い,収束のスピードや加速法などの性質を調べて来た.今後は,この方法を,不完全データにもとづく推定関数のパラメータが推定できるように拡張する.そして,その収束のスピードや加速法についても調べる.これらの研究は,研究目的にある「推定量」ではなく,「推定値」についてのものである.しかし,これらは次の意味で,推定量に関係している.FS法は,適当なパラメータの推定値をもとにして,その推定値をより良い値に改善する方法である.「より良い値」とは,パラメータの真の値に近いということである.この式に,実際の値である推定値を代入するのではなく,理論上の存在である推定量を代入しても,やはり推定量は真の値に近づくことが期待できる.そして,この操作の極限を取れば,結局本来の目的の推定量の分布を導出したことになる.実際,真の分布が正規分布の場合には,FS法によって推定量が改善されるだけでなく,分散も減少し,最終的には理論上の下限になることが分かっている.本年度は,これらの結果を拡張して一般の分布の最尤推定量やそれ以外の推定方法による推定量の分布についての研究を行う.
|
Causes of Carryover |
本年度は,9月から在外研究の機会に恵まれたため研究が計画通りに進まなかった.この在外研究の間に本申請課題を発展させるために当地の研究者との共同研究を行うことを意図している.共同研究自体は2016年の後半から行うため,成果の発表が従来申請していた期間から遅延することになった.そのためこのようになっている次第である.
|
Expenditure Plan for Carryover Budget |
本年度は,以上の研究計画による研究成果と在外研究中の成果をまとめ,発表するために予算を使うことを計画している.第一には,日本国内,国外の両方での研究発表に参加するための旅費として利用する.第二には,論文の英文を校閲するときに使用する予定である.
|