2020 Fiscal Year Research-status Report
セミパラメトリック統計解析におけるモデル選択理論の構築
Project/Area Number |
16K00050
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
二宮 嘉行 統計数理研究所, 数理・推論研究系, 教授 (50343330)
|
Project Period (FY) |
2016-04-01 – 2022-03-31
|
Keywords | 因果推論 / 傾向スコア解析 / 欠測データ解析 / 情報量規準 / スパース推定 / セミパラメトリック推定 / 統計的漸近理論 / モデル選択 |
Outline of Annual Research Achievements |
因果推論において基本的なものである周辺構造モデルに対し,傾向スコアを用いたセミパラメトリック推定法に対処できる情報量規準を,そのモデル選択問題のために導出した,というのが前年度までの結果である.基本的なものである逆確率重み付け推定だけでなく,二重頑健推定を扱い,また情報量規準自体に二重頑健性を持たせたり,ロジスティック回帰や構造方程式モデリングといった枠組みに対しても対処できるよう,AIC 型の情報量規準に拡張したりした.しかし,それらで推定対象にしたのは,常に ATE (Average Treatment Effect) であった.一方,応用の場では,ATT (Average Treatment effect on Treated) や ATU (Average Treatment effect on Untreated) が推定対象になることも多々ある.そこで,これらを含む一般の因果効果に対するものに情報量規準を拡張したのが,本年度の主結果である.情報量規準は,交絡変数を与えたときの割り当て変数の期待値と,交絡変数を与えたときの結果変数の期待値を含み,モデルが誤っていることを許容する二重頑健推定の設定で,これらは解析的に評価できない.しかし,これらが一つずつ積の形で現れるように一般化する限り,経験推定量で置き換えて漸近論で保証させることが可能である.副結果としては,通常用いられる Kullback-Leibler ダイバージェンスに基づく推定に加え,外れ値に強いダイバージェンスに基づく推定にも対応できる情報量規準への拡張を行った.この頑健性は上述の二重頑健性とは別種のものであり,その意味でこの推定・モデル選択手法は三重頑健性をもつと言える.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
二重頑健基準については,実は二年前の報告で開発したことを書いていたが,それは評価できないパラメータ値に依存する関数を含むものであった.本年度,一般の因果効果に対するものに情報量規準を拡張するにあたり,そのパラメータ値を求めることなく関数を評価できることを見出しており,開発した二重頑健基準に弱点がなくなったという観点から,意義は小さくないと考えている.そういった意味で「順調に計画は進んでいる」といえる.一方で,手法の有用性をチェックするための数値実験が完成しておらず,それを遂行していれば区分を「当初の計画以上に進展している」にできたと思っている.現時点において,最もシンプルな設定では,既存手法に対する提案手法の明らかな優位性を確認できており,枠組みを広げてそれが崩れることは想像できない.
|
Strategy for Future Research Activity |
本年度までに開発してきた情報量規準においても,まだ対処できないであろう設定がある.それは,交絡因子が結果変数に影響を及ぼすが,例えば結果変数の差の期待値として定義される因果効果には影響が及ばない,という設定である.このとき,因果効果の推定のためにはその交絡因子を外したいが,開発してきた情報量規準はそれを選択してしまう.この問題を回避するため,フォーカスしたパラメータに影響を及ぼす因子を選択する基準である FIC (Focused Information Criterion) を,傾向スコア解析の枠組みで開発する予定である.傾向スコアを用いない因果推論において,FIC は優れた性能をもつことが実は既に検証されており,この開発が意義をもつことに間違いはない.
|
Causes of Carryover |
コロナ禍により,出張がキャンセルになったことと開催予定であったワークショップが中止になったことが,次年度使用額が生じた理由である.コロナ禍がある程度収束したら,ワークショップを開催し,国外からモデル選択を専門とする研究者を招聘することで,研究を促進させる予定である(海外招聘旅費:400千円/人×2人=800千円).また,手法のさらなるカスタマイズ・改良を目的とした国内研究者との交流を予定する(国内旅費:100千円/回×2回=200千円).それ以外では,書籍や謝金などで使用することを計画している(書籍:105千円,謝金:100千円).
|