2007年に実施された郵送調査とインターネット調査のデータセットを使い、いくつかの変数に関してそれぞれの分布をより正確と思われるデータと比較した。まず年齢について2006年11月の人口推計と比較すると、郵送もインターネット調査も15~19歳のサンプルが少ない。特にインターネット調査のほうが歪みが大きい。しかし、その他の年齢に関してはむしろ、インターネット調査のほうが歪みが小さかった。また性別に関してもインターネット調査のほうが歪みが小さい。最終学歴に関しては、郵送もインターネットも、女性の高学歴サンプルが過大に含まれ、中卒男女のサンプルが過小に含まれていた。また、インターネット調査に関しては男性高学歴者も過大に含まれていた。 さらに、結婚時の理想の働き方を女性に対して尋ねた質問項目のゆがみを、出生動向基本調査と比較することで検討した。その結果、郵送調査では18~24歳で就業継続希望者が過小に含まれており、25~29歳で中断希望者が過大に含まれていた。インターネット調査は、出生動向基本調査と大差ない分布であった。この理想の働き方と、本人の従業上の地位などの変数との関連の仕方を対数線形モデルやロジスティック回帰分析で比較したが、インターネット調査と郵送調査で有意な違いは見いだせなかった。 このような分析結果を総合すると、インターネット調査を行う場合、年齢、性別、学歴という3変数に関しては、クォータ法を使ってあらかじめ割り当てておくことが必要である。今回の分析では、無職と非正規雇用を意図的に過大にサンプリングしたので職種がどのように歪むかはわからなかった。いずれにせよ、分布が既知の重要な変数に関してはできるだけ細かく割り当てを行うことが、インターネット調査の代表性を高める上で重要であることが分かった。また、1変数の分布だけを見れば、若干の歪みが見られるものの、変数間の関連の強さに関しては有意な違いが見られず、一定の有効性があると考えられる。
|