本研究の目的は,欠測データ分析における「無視可能性」の新たな構築であった.欠測データを発生させるメカニズムが無視可能という性質を持つ場合,観測されたデータから必要な最尤推定値を(漸近的には)正しく推定できることが知られている.しかし,従来の無視可能性という概念は,二重に数学的に扱いにくい.一つは,無視可能性がそもそも扱いにくいことである.もう一つは,無視可能性の下での推定値の計算が複雑になることである.前者の問題に対して,これまでに無視可能性と同等の表現である,変数間の独立性を導出してきた.変数間の独立性は,統計学では重要な概念なので,様々な計算法,表記法がすでに開発されているという利点がある. 最終年度には,上に述べた無視可能性の二つ目の問題に取り組んだ.欠測データがあるときには,変数の数,従ってパラメータの要素が,オブザベーションごとに異なり,尤度が複雑な形になる.そのため推定値や推定量の性質を調べることが難しかった.本研究では,この困難を克服する方法として,選択行列を導入した.選択行列を用いることでパラメータの要素を全オブザベーションで共通にすることができる.その結果,推定値の導出や推定量の性質の計算が容易になる.選択行列は,データを確率変数と見るかどうかによって,定数か確率変数かのどちらかとして扱われる.データが定数の場合には,選択行列は定数である.一方,データを確率変数として扱う場合には,選択行列もまた確率変数である.選択行列が定数のときには,最尤推定値の明示的な形を示し,EMアルゴリズムと最尤推定値との関係を与えることができた.選択行列が確率変数のときには,EMアルゴリズムのワンステップ推定量としての性質や最尤推定量の陽な形の分散共分散行列を与えることができた.
|