2022 Fiscal Year Research-status Report
Robust estimation with effective learning
Project/Area Number |
17K00065
|
Research Institution | The Institute of Statistical Mathematics |
Principal Investigator |
藤澤 洋徳 統計数理研究所, 数理・推論研究系, 教授 (00301177)
|
Project Period (FY) |
2017-04-01 – 2024-03-31
|
Keywords | ロバスト統計 / 逆確率重み法 / 二重頑健推定 / 敵対的汚染 / スパース推定 / 非漸近理論 / 収束レート |
Outline of Annual Research Achievements |
因果推論で使われる逆確率重み法や二重頑健推定は外れ値に弱いことが知られている.これまでの研究は中央値を使ったアドホックなものであったため,べき密度を利用して,外れ値により強くより妥当な手法を開発した.研究の詳細は前年度までの実績に記述している.投稿中の論文は Statistica Sinica に受理された.
外れ値などが存在するときに,その汚染によっても推定値がずれにくいパラメータ推定手法として,ロバスト推定がある.データが通常のHuberタイプの汚染よりも強力な,敵対的汚染にさらされた場合に,ロバスト推定の収束レートを調べる研究は,この数年,非常にホットな話題である.敵対的汚染は,データの状況を見てから汚染が可能なため,非常に強力な汚染を可能にする.本研究では,線形回帰において,ノイズだけでなく,特徴量も敵対的汚染にさらされる場合を考察した.加えて,特徴量が高次元であり,真の回帰係数はスパースであるという,スパース高次元回帰の設定で研究を進めた.ノイズに関しては裾が重い分布,特徴量に関してはLサブガウス分布と,過去よりも緩い仮定とした.特徴量の共分散が既知の場合と未知の場合を分けて考察を進めたが,共分散が既知の場合は,ある特定の推定量に対しては,過去の研究よりも鋭い収束レートを得た.証明には generic chain という最近の技法を使っており,これが鋭い収束レートを得るためのコアの技法となっている.論文を完成して現在投稿中である.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
一つの研究は論文が受理されるまでに時間がかかった.ロバスト推定の収束レートの研究は,理論研究であり,その証明に思いのほか時間がかかった.しかし,当初の想定よりは進んだ研究となった.
|
Strategy for Future Research Activity |
投稿中の論文をきちんと受理まで進める.
|
Causes of Carryover |
コロナ禍で研究が遅れたため
|
Research Products
(3 results)