2019 Fiscal Year Research-status Report
Project/Area Number |
19K13667
|
Research Institution | Chiba University |
Principal Investigator |
川久保 友超 千葉大学, 大学院社会科学研究院, 准教授 (80771881)
|
Project Period (FY) |
2019-04-01 – 2022-03-31
|
Keywords | 小地域推定 / 変数選択 / 混合効果モデル |
Outline of Annual Research Achievements |
本研究の目的は,小地域推定における変数選択問題に取り組み,統計の一般理論で得られた変数選択の手法を小地域推定に応用する際の問題点を明らかにするとともに,それらを解決すべく新しい手法を開発することである。「小地域推定における変数選択」という大枠のテーマのなかで,今年度は特に【(1)OBP法にもとづいた変数選択】と【(2)標本調査のデザインを考慮に入れた分析が必要な場合の変数選択問題】の2件の研究に取り組んだ。 まず(1)の研究の説明を行う。小地域推定モデルの未知パラメータを推定する方法として,observed best prediction (OBP) 法と呼ばれる手法が近年提案された。OBP法ではモーメント条件のみしか確率分布の仮定を利用していないことから,モデルが真の構造をとらえ誤っている状況下において,従来手法よりも予測リスクが小さくなると主張されている。そこで,OBPと同様のリスクの測り方で,未知パラメータの推定のみならず,変数選択を行う手法を考えた。 次に(2)の研究の説明を行う。層化抽出法などの,等確率で標本を抽出するとは限らないデザインで行われた標本調査においては,標本調査によって得られた観測データを単純無作為抽出によって得られたデータであると想定して分析すると,母集団の特徴を不偏にとらえることができなくなる。このような意味での不偏性は,確率モデルの不偏性と区別され,デザイン不偏性と呼ばれる。デザイン不偏性を保ちながらも確率モデルに依拠した予測量を導出する方法としては,survery weightと呼ばれる調査のデザインから導出される既知の重みを利用する方法が提案されている。しかし,survey weightを用いた推定が必要な状況下での小地域推定モデルの変数選択規準は,先行研究では考案されていない。そこで,このような問題における変数選択規準の開発を試みた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
上述した【(1)OBP法にもとづいた変数選択】の研究については,国際査読誌Journal of Multivariate Analysisに掲載された。また,シンガポールで開催された小地域推定の国際学会にて,同研究に関する研究発表を行い,聴衆との意見交換も行った。 また【(2)標本調査のデザインを考慮に入れた分析が必要な場合の変数選択問題】については,研究の構想段階であるが,以下のような進捗がある。標本調査のデザインを考慮に入れたパラメータの推定手法として,survey weightを用いた重み付き尤度を最大化する,weighted likelihood estimator (WLE) に関する先行研究が多く存在する。この重み付き尤度に基づいた,小地域推定モデルの変数選択法を現在開発中である。 さらに当該研究課題に関連した研究として【(3)グループデータからの所得の空間的分布の推定】,【(4)空間的にパラメータの値が変化するベイズモデルの開発と小地域推定への応用】,【(5)グループデータに対する小地域推定】,【(6)時系列グループデータを用いたロレンツ曲線のベイズ推定】に本年度取り組んだ。(3)と(4)の研究は,それぞれComputational Statistics & Data AnalysisおよびJournal of Statistical Computation and Simulationに掲載された。また(5)については,国際学会および所得分布に関するワークショップで講演を行い,また国際査読誌に投稿し査読を経て改訂作業中である。(6)については,国際査読誌に投稿し,査読を経て改訂作業中である。 このように,研究計画はおおむね順調に進展していると言える。
|
Strategy for Future Research Activity |
今後は,以下の3つの研究を進めていく。 1つ目は,上記【(2)標本調査のデザインを考慮に入れた分析が必要な場合の変数選択問題】を発展させていくことである。現在,変数選択法を開発し,数値実験で性能を確かめている段階である。ここから理論的な性質を調べ,また実データへの適用可能性を検討し,研究を深めていく。一定の成果が出た後は,国際学会での発表を行ったり,論文にまとめ国際査読誌に投稿することを目指していく。 2つ目は,グループデータに対する小地域推定モデルにおける変数選択問題に取り組むことである。【現在までの進捗状況】で言及した関連する研究のうち(3)と(5)は,グループデータに対する空間統計モデルおよび小地域推定モデルに関する研究であった。これまで,小地域推定モデルでは地域ごとの標本平均などの集計データに対してモデリングを行うことが多かった。一方で,地域ごとに度数分布などのグループデータが利用可能な場合は,標本平均などの集計データよりも情報量が多く,グループデータを直接モデリングすると推定の精度が上がることが期待される。そこで,(3)と(5)の研究ではグループデータに対するモデリングを行なった。しかし,これらのモデルに対しては,変数選択をどのように行うのかという課題が残っている。そこで,グループデータに対する小地域推定モデルにおける変数選択法の開発を目指す。 3つ目は,【(7)変数選択の不確実性を考慮に入れたMSEの評価】の研究に取り組むことである。小地域推定においては予測量のMSEを見積もることも重要な研究テーマである。しかしながら,ほとんどの先行研究では,どの補助変数を利用するかも含めてモデルが正しいという仮定のもとでMSEの推定量が導出されているため,変数選択の不確実性も考慮に入れたMSEの評価・推定法を開発する。
|
Causes of Carryover |
当該年度は,研究基盤整備としてデータセット購入費を予算計上していた。購入したデータセットを用いることで,開発した統計手法の実データ適用可能性を効率的に検証することができ,また手法の改善を行うことが期待される。しかしながら,当該年度は,統計モデルの開発とコンピュータで生成した乱数による数値実験での性能評価に研究の進捗がとどまり,実データへの適用は行わなかった。次年度には実データへの適用という段階まで研究の進捗が期待されるため,次年度にデータセットを購入する計画である。その他,次年度分として請求していた助成金については,当初の計画通り,数値計算を回すためのコンピュータを購入するための物品費,学会発表のための旅費に多くを使用する計画である。ただし,新型コロナウイルスの流行状況によっては,計画通りに学会発表を行えなくなる可能性もあるため,その際は最終年度である次々年度に旅費を使用する。
|