2020 Fiscal Year Annual Research Report
Statistical inference in exploratory data analysis and its application
Project/Area Number |
18K18010
|
Research Institution | Nagasaki University |
Principal Investigator |
梅津 佑太 長崎大学, 情報データ科学部, 准教授 (60793049)
|
Project Period (FY) |
2018-04-01 – 2021-03-31
|
Keywords | モデル選択 / selective inference / 仮説検定 / スパース正則化法 / 高次元漸近理論 |
Outline of Annual Research Achievements |
本年度も引き続きモデル選択後の統計推論であるpost-selection inferenceについて研究を行った. Lassoなどで選択されたモデルに対して, 選択された変数の検定を行う場合, 選択バイスの影響で妥当な統計推論が困難となる. モデル選択によるバイアスを解消するための方法論として, 高次の交互作用高を持つ線形回帰モデルに対して, forward stepwise regressionによってモデル選択を行った際のselective inferenceや, 最も簡単な因果推論モデルにおいて, 条件付き処置効果に寄与する変数をLassoで選択する場合のselective inferenceに関する提案を行った. 前者は, 高次の交互作用をスクリーニングするために, 枝かりを用いて効率的にモデル選択を行うことが可能となった. また, 因果推論モデルでは, 局外母数の推定を避けつつ高次の漸近理論を用いることで, 条件付き処置効果に寄与する変数に対する条件付き信頼区間を与えた. また, 非線形構造を持つ回帰モデルに対するスクリーニングに関する研究も引き続き行った. スクリーニングでは, 適当なしきい値に基づきモデル選択を行うが, 客観的に選択しなければ解析結果に恣意性が生じてしまう. そこで, 本年度は, 昨年度提案したスクリーニングのスコアの漸近分布に基づき, expected false positive rateをコントロールするようにしきい値を選択することを提案した.
|
Research Products
(7 results)