研究概要 |
「標本数Nを十分大きくとると帰無仮説は必ず棄却される」という経験則がある.サイズαの検定は,帰無仮説H_0の下では,Nに関わらず100(1-α)%の確率でH_0を棄却しないはずである.しかしながら,標本数Nを十分大きくとれば,ほとんどの場合H_0は棄却される.仮説H_0を棄却したければNを十分大きくとってやればよいということになり,これはデータに基づく科学的判断ではなくなる.統計解析の誤用・悪用の一例である.このような問題はほとんどの仮説検定問題で起こる. 本研究では,モデルの適合度検定において上記問題を検定した.因子分析モデルの適合度検定は,母集団の共分散行列をΣとしてH_0 : Σ=ΛΛ'+Ψ versus H_1 : Σ is not restrictedとなる.H_0が棄却されないならばこのモデルはデータに矛盾しないと判断する.小標本(e.g.,N=100)の予備実験で因子分析モデルが上手く当てはまったが(小標本受容モデル),本格的に大標本(e.g.,N=2000)のデータをとり適合度検定を行うとモデルが棄却された(大標本棄却モデル).このようなことはしばしば見受けられ,研究者を困惑させる.統計家はもちろんこの事実を熟知している.統計家の解釈は次のようである.帰無仮説が棄却されないのは標本数N=100が小さすぎるからだ.検出力1-βを考慮の上検定法を再構築すべきである.また,N=2000は大標本だ.モデルが棄却されても仕方がない,N=2000でp-値がこの位だと適合度は悪くない.このように,検定結果をそのまま信用せず,標本数Nとの係わりのなかで過去の経験に頼り最終判断を下していることが多い.本研究では,このような熟達した統計家の経験に基づく判断を,何らかの意味で客観化するような数学的指標を構築することを目的として,以下の統計量を提案した. モデルは現実の近似でありデータは対立仮説から採られているという状況を考える.サイズαの検定においてγ(α<γ<1)を与え,次の量を定義する. N_<α,γ>=^<def>H_0が確率γ以上で棄却される最小の標本数N N_<α,γ>は,ある意味で,真値の帰無仮説からの距離を表している.実際,N_<α,γ>が大きければ真値は帰無仮説に近く(従って大きな標本数が必要になる),小さければ帰無仮説から遠いことになる.適合度検定の場合はN_<α,γ>の大小でモデルの良さを計る,すなわち,N_<α,γ>が大きければ良いモデル,小さければ悪いモデル,ということになる. N_<α,γ>の推定方法としてbootstrap法を採用し,その近似がある意味でうまく行くことを数値実験により実証した.この研究成果を,9月に行われた日本行動計量学会年会にて発表した.
|