本研究では,無視できない欠測値を含むデータに対するモデル選択方法論の開発を行う計画である.無視不可能な欠測値データに関しては,モデル選択以前にパラメータの推定方法すら上手く確立されていないため,初めに次の2つの研究に着手した: ①無視可能な欠測値データに対する情報量規準の導出; ②無視不可能な欠測値データに対するセミパラメトリック最有効推定量の導出.まず,①で無視不可能な状況ではなく,より簡単な無視可能な状況での情報量規準を導出した.また②で,無視不可能な状況で情報量規準を導出するために,まず無視不可能な状況でのパラメータ推定法について研究した.
【研究①について】TIC (Takeuchi Information criterion)をデータに無視可能な欠測値が含まれる状況でも扱えるよう拡張した.欠測メカニズムが無視可能であるという仮定は,実用上しばしば置かれる仮定であり,この下で扱える情報量規準は応用上必要不可欠である.TICは,データに欠測値が含まれない場合における,真の分布とモデルのある種の“距離”,KL(カルバック・ライブラー)ダイバージェンス,の漸近不偏推定量であるため,この統計量を見ることでどの候補モデルが真の分布に近いかを測ることができる.
【研究②について】無視不可能な欠測値データに対して,古典的な解析法では欠測メカニズムに加えて検証不能な,データの分布に関する仮定が必要となり,この分布を誤特定すると推定量の一致性すら保障されない.本研究では,データの分布に関する仮定を必要とせず,またセミパラメトリック漸近有効下限に達する適応的推定量を提案した.セミパラメトリック漸近有効下限とは,データの分布に関する仮定を必要としない推定量の中で,最も漸近分散が小さい推定量のことである.
|