2019 Fiscal Year Research-status Report
セミパラメトリック統計解析におけるモデル選択理論の構築
Project/Area Number |
16K00050
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
二宮 嘉行 統計数理研究所, 数理・推論研究系, 教授 (50343330)
|
Project Period (FY) |
2016-04-01 – 2021-03-31
|
Keywords | 因果推論 / 傾向スコア解析 / 欠測データ解析 / 周辺構造モデル / 情報量規準 / セミパラメトリック推定 / モデル選択 / 統計的漸近理論 |
Outline of Annual Research Achievements |
因果推論において基本的なものである周辺構造モデルに対し,傾向スコアを用いたセミパラメトリック推定法に対処できる情報量規準を,そのモデル選択問題のために導出した,というのが前年度までの結果である.一方,近年重要になってきているのは,選択すべく交絡変数の数が多いときの話であり,機械学習分野を中心として今や標準ツールとなっているスパース推定法が利用されはじめてきている.そこで,これまでの結果にスパース推定法を組み込み,スパース推定法におけるモデル選択の度合いを定めるチューニングパラメータを与えるための情報量規準を導出した.これが本年度の主結果である.因果推論で利用されてきている既存のスパース推定法は,「結果変数に依存していても割当変数に依存していないと変数を落としてしまう」や「結果変数と交絡変数の関係が非線形であるときは扱えない」といった,因果推論においては致命的ともいえる弱点を有しているが,本設定はそれを克服したものとなっている.また,それら既存の方法は,良い性質を与えるチューニングパラメータのクラスを与えているのみであり,結局そのクラスの中の何を用いるかで恣意性を生じさせるものとなっているが,数理的妥当性をもつチューニングパラメータを一つ与える本結果は,そういった恣意性を有さない.結果は Cp 基準の形で与えているが,ロジスティック回帰や構造方程式モデリングといった枠組みに対しても対処できるよう,AIC 型の情報量規準に拡張することも可能な枠組みとなっている.また,スパース推定においては,チューニングパラメータの選択を除いて既存のパッケージを用いればよい方法となっており,実装が容易なものとなっている.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
因果推論とスパース推定は,どちらも統計学あるいは機械学習においてホットトピックとして扱われてきたものであり,その融合は現在競争的に行われてきている.その中において,既存手法の致命的な弱点を見出し,それを克服する手法を開発できたことの意義は小さくないものと考えており,そういった意味で「順調に計画は進んでいる」といえる.一方で,手法の有用性をチェックするための数値実験が進んでおらず,それを終えていれば区分を「当初の計画以上に進展している」にできたと思っている.上述のように既存手法は致命的な弱点をもっているため,それが顕在化するような設定において提案手法の優位性を示すことは難しくなく,顕在化しないような設定においての同等性を示せばよいと考えている.
|
Strategy for Future Research Activity |
スパース推定を取り込んだことを活用し,それと相性の良い selective inference の理論を開発する.因果推論と selective inference の融合は,流行という観点からしても急務の課題といえるが,これまで一つの論文があるのみである.しかし,これにはやはり「結果変数と交絡変数の関係が非線形であるときは扱えない」という致命的な弱点があるため,30年度で扱った設定を引き継ぐことでそれを克服する予定である.selective inference では pivot 統計量を構成する必要があり,因果推論でそれを行うためには理論を拡張しなければならないが,実現可能であると予想している.もちろん,パッケージ化することも含め,実装を進める.
|
Causes of Carryover |
国内研究者との交流を目的とした出張を優先させ,国外研究者との交流を目的とした出張と大規模な数値実験を行うための最新のパーソナルコンピュータの購入とを控えたことにより,次年度使用額が生じている.本年度は前年度までに開発した手法の有用性を確認するため,最新のパーソナルコンピュータを二台購入する予定である(800千円).また,手法のさらなるカスタマイズ・改良を目的とした国内外研究者との交流を予定している(国外旅費:200千円,国内旅費:200千円).それ以外では,書籍や謝金などで使用することを計画している(書籍:93千円,謝金:80千円).
|