サンプルサイズが小さい地域の何らかの平均値を推定する際、小地域推定の手法は予測リスクを改善するため有用である。貧困率と失業率などのように相関をもった多次元データが観測されたとき、それらを同一のモデルに組み込んだ多変量モデルについての研究も進んでおり、相関を考慮した予測量がよりリスクを改善することが知られている。一方で、近年ではデータが膨大になり、小地域推定の文脈でも、観測ベクトルの次元が大きい観測値が得られる事例が見受けられるが、高次元モデルの下で小地域推定問題を考察した研究は行われていない。小地域推定の理論的成果は漸近近似に基づくが、観測値の次元が大きい場合は近似誤差が大きくなるため、従来の方法を高次元データに当てはめると誤った推定結果を得る恐れがある。 そこで本研究は,観測次元の二乗と地域数の比が定数に収束するような設定の下で、多変量小地域推定問題を考察した。モデルとしては、各地域の集計データのみが得られているFay-Herriotモデルを考え、変量効果と誤差項はそれぞれ独立に多変量正規分布に従うと仮定した。そのため、パラメータとしては回帰係数と変量効果の共分散行列になるが、それぞれ最小二乗推定量とモーメント推定量で推定した。本研究では、これらのパラメータの次元も地域数とともに発散するが、標準的な仮定の下で推定量が真の値に収束していくレートを示した。小地域平均ベクトルはそのベイズ推定量にパラメータの推定量を代入した経験最良不偏予測量で予測し、そのリスクとして平均二乗誤差と信頼区間を漸近近似に基づいて評価した。なお、この近似は誤差が地域数に関して2次のオーダーになるように行ったが、平均二乗誤差と信頼区間ともに、観測次元が固定されているときの結果と比べて、追加的な項が現れることが確認できた。 現在は数値実験等を行い、その結果をまとめ学術雑誌への投稿を準備している。
|