研究実績の概要 |
回帰分析においてモデルの良し悪しを評価する標準的な基準は決定係数である. これは実測値と予測値との相関係数の2乗であるため, 0以上,1以下の値を取る絶対量である. 異なるデータセットでも同じ決定係数を持てば目的変数の予測値と実測値の線形性の強さがわかる性質をもつ. 本研究は評価基準を再考することを目的とする. 7年度は回帰モデルの評価基準の一般化を2つの設定で考察した. 1) 分散不均一の場合の回帰モデルの評価. 決定係数は誤差分散が一定の回帰モデルにおいて, 説明変数を用いたモデルと用いないモデルの分散比と見ることができる.これを分散不均一の場合に一般化した. すなわち分散不均一の場合の決定係数を, モデルに基づく平均の予測値と実測値の差の2乗に対し, 推定分散の逆数による重みを付けて和を取るヘテロ決定係数を定義した. この提案は誤差分散が一般化線型モデルで与えられるケースに適応可能であり, 27年度発表した論文では,BICの評価が決定係数よりヘテロ決定係数に近いことが実データ解析でわかった. 2) 時空間データの回帰モデルの推定法とモデル評価法 時空間で相関を持つデータに対する回帰モデルは母数推定には逐次的手法が必要であり, 必ずしも安定的に推定できるわけではない. ここでは次の2段階推定とモデル評価を提案した. (1)データが時空間に対して独立であるという独立モデルにより回帰係数を推定する. (2) 独立モデルで各標本における目的変数を予測し, 依存すると考えられる複数の予測値で実測値に回帰する.(3) モデル評価は (1),(2) で用いた全ての母数により AIC 等で評価する.この提案は回帰母数の推定値が閉じた形で得られ, また実データで有用であることがわかった. 現在発表準備中である.
|