因果推論で使われる逆確率重み法や二重頑健推定は外れ値に弱いことが知られている.これまでの研究は中央値を使ったアドホックなものであったため,べき密度を利用して,外れ値により強くより妥当な手法を開発した.研究の詳細は前年度までの実績に記述している.投稿中の論文は Statistica Sinica に受理された.
外れ値などが存在するときに,その汚染によっても推定値がずれにくいパラメータ推定手法として,ロバスト推定がある.データが通常のHuberタイプの汚染よりも強力な,敵対的汚染にさらされた場合に,ロバスト推定の収束レートを調べる研究は,この数年,非常にホットな話題である.敵対的汚染は,データの状況を見てから汚染が可能なため,非常に強力な汚染を可能にする.本研究では,線形回帰において,ノイズだけでなく,特徴量も敵対的汚染にさらされる場合を考察した.加えて,特徴量が高次元であり,真の回帰係数はスパースであるという,スパース高次元回帰の設定で研究を進めた.ノイズに関しては裾が重い分布,特徴量に関してはLサブガウス分布と,過去よりも緩い仮定とした.特徴量の共分散が既知の場合と未知の場合を分けて考察を進めたが,共分散が既知の場合は,ある特定の推定量に対しては,過去の研究よりも鋭い収束レートを得た.証明には generic chain という最近の技法を使っており,これが鋭い収束レートを得るためのコアの技法となっている.論文を完成して現在投稿中である.
|