まず分散不均一な場合のモデル選択を考えるにあたって、分散を推定させるように正規乱数からデータを発生させた。いくつかの違う分散をもつグループを何パターンかにわけて乱数を発生させ、直接分散を推定して、以前考えた真の母数がわかっている場合のモデルの選択式に代入してみた。その結果はとくにクラスの数が比較的多くて、しかも分散の不均一性の度合が非対称の場合、OLSの方が良いと間違える場合が増加する傾向にあることがわかった。このこと自体は以前からの研究でも予想できるものであったが、分散を推定させる場合はかなりはっきりと傾向がでていた。そこでむしろ分散の不均一性の度合をある一定水準からの距離の差の大小で、それ以上ならば推定された分散を使い、それ以下のものは以たような距離のものは一まとめにしておくことにした。そうやって推定するべきパラメータの数を予備的に減少させ、さらに非対称か対称かあいまいなものは積極的に対称だとすると少しばかりモデル選択を間違う度合が減少する結果となった。ただしこの結果はデータの数に依有してしまうので、特に非対称か対称かを決める問題ではデータの数が少ないほど意味を持つ。またこの問題を固有値、固有ベクトルの問題におきかえてシミュレーションをやってみたが普通に分散を推定させた時と較べても結果は変わらなかった。またデータの数が多数のときは普通に2段階最小2乗法を行うと結果はあまり変わらなかった。
|