Cramer(1987)が指摘しているように、回帰モデルのデータへのあてはまりの尺度として常時参照される決定係数は、母決定係数(標本決定係数の確率極限として定義される。)をかなり過大推定する傾向がある。すなわち、決定係数は上への偏りのある推定量である。また、Cramer(1987)は、自由度修正決定係数の偏りは決定係数よりも小さいが、分散は大きく、精度の上で問題であるとしている。 本研究では、回帰モデルを特定化するときに、適切な説明変数が誤って省略された場合と、不適切な説明変数が誤って含まれている場合の2つの型の特定化過誤を想定し、決定係数および自由度修正決定係数の密度関数を導出した。適切な変数が省略された場合に決定係数および自由度修正決定係数が過大推定されれば、応用研究者はこれらの値が大きいことに満足し想定された回帰モデルで十分データに適合していると判断するおそれがある。従って、この場合には、過大推定が過小推定よりも重大な損失をもたらすと考えられる。本研究では、決定係数および自由度修正決定係数の密度関数に基づいて、非対称な線形損失関数のもとでの危険関数を導出し、危険関数の数値計算を行った。主な結果は次の通りである。1.適切な説明変数が省略されおり、過小推定が過大推定よりも問題であるときには、決定係数の方が自由度修正決定係数よりも小さな危険をもつ。しかし、過大推定の方が問題であるときには、自由度修正決定係数の方が危険が小さい場合がある。2.不適切な変数が含まれており、過小推定の方が問題であるときには、決定係数の方が小さな危険をもつ。しかし、過大推定の方が問題であるときには、自由度修正決定係数の方が危険が小さい。
|