2021 Fiscal Year Annual Research Report
Developing a theory for model selection in semiparametric statistical analysis
Project/Area Number |
16K00050
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
二宮 嘉行 統計数理研究所, 数理・推論研究系, 教授 (50343330)
|
Project Period (FY) |
2016-04-01 – 2022-03-31
|
Keywords | 因果推論 / 傾向スコア解析 / 情報量規準 / スパース推定 / セミパラメトリック推定 / 統計的漸近理論 / モデル選択 / SURE理論 |
Outline of Annual Research Achievements |
一般化線形モデルの因果推論版といえるような基本的なモデルに対し,傾向スコアに基づく標準的なセミパラメトリック推定法(具体的には逆確率重み付け推定法や二重頑健推定法)を用いるときのための情報量規準を導出した,というのが前年度までの結果である.因果推論でも説明変数の候補数が大きいケースは当然あり,スパース推定が用いられるようになってきている.本年度の主結果は,そのスパース推定において必要となる正則化パラメータの決定のために,情報量規準を開発したことである.まず,正規分布ベースの因果推論モデルに対し,通常のスパース推定においてほぼ弱点のない一般化 Cp 基準を導く SURE 理論を発展させ,逆確率重み付けスパース推定版の一般化 Cp 基準を漸近論に頼らず導いた.次に,正規分布ベースとは限らない一般の因果推論モデルに対し,二重頑健推定も念頭に,LASSO の漸近理論を傾向スコア解析のために発展させた.そして,逆確率重み付けスパース推定のための AIC タイプの情報量規準を与えるとともに,二重頑健スパース推定のため,基準自体にも二重頑健性をもたせたものを導いた.数値実験では,提案基準と形式的な議論で導かれた既存基準を比較し,ほぼすべてのケースで提案基準が優越すること,多くのケースでその差は無視できないものであること(つまり変数選択の結果が大きく異なること)を検証した.また実データ解析では,実際に両基準による変数選択と推定値の違いが大きいことを確認した.
|