本研究の目的は近年、利用できる機会が多くなったカテゴリーデータをもちいた統計的分析をおこなう際の推定量や検定統計量の性質を明らかにすることである。それらの多くは漸近的な性質が明らかになっているが、欠損値を多く含む場合や、各カテゴリーに含まれるデータ数に大きなばらつきがある場合など、通常の漸近理論では必ずしもその特性は明らかではない。 本研究年度では、もっともその利用の機会が多い、カテゴリーが二つの場合に限定し、プロビットモデルやトービットモデルを使った最尤推定量に焦点をあてた。片方のカテゴリーに含まれるデータ数ともう一つのカテゴリーに含まれるデータ数の比率を考えた場合、その比率がゼロに収束する状況では解が存在しないことが解析的に示された。さらに解が存在する状況下であっても、有限標本では、モンテカルロ実験により調べた結果、最尤推定量には無視できないバイアスが存在している可能性が示された。このバイアスは漸近的には消失するが、有限標本においては、このバイアスを補正することが適切な統計的推論をおこなう上で必要とされる。従って、現在は引き続き、このバイアスを補正する方法を漸近展開の手法を援用することで提案する試みを行っている。また最尤推定法以外の推定法としてベイズ推定の適用可能性についても検討中である。さらにカテゴリー数がより多くなった際には各カテゴリーに含まれるデータ数のばらつきは大きくなるので、そのような状況下での分析も計画中である。
|