「数理」「データサイエンス」「AI」に対して、現在嘗てない程に需要があらゆる分野から高まっている。その期待に応える為、統計学的モデルは非常に多様化している。多種多様なデータから結論を適切に導く為には、各々の問題に即した分析法が必要であるが、そこで置かれる前提は時に、従来の統計手法が置いている仮定から逸脱してしまう。本研究に於いて中心的に検討しているのは「外れ値」、他のデータから大きく離れた値を持つ、モデルから見た想定外の存在の扱いである。定義や線引きが曖昧な外れ値を適切に処理し、外れ値の有無に依らない「頑健」な分析を為すことは極めて重要である。 本研究では、外れ値に対し頑健な分析法を、特に統計学的ダイバージェンスに基づくモデル評価規準に焦点を当てて理論的に究明している。従来の規準の多くは外れ値に適切に対応する性質を有さず、観測の中に一つでも極端な外れ値があると、外れ値がない場合には有り得ない様な選択をしてしまう場面が多い。本研究成果の主な一つである、情報量規準BICをダイバージェンスに沿って拡張した規準DBBCは、BHHJ divergence等の適切なダイバージェンス族を用いると、極端な外れ値にも耐える選択規準と為ることが本研究の中で示された。 また、本年度は特に、回帰分析に於けるスパース正則化に対して、正則化パラメータの決定に資する頑健な規準の開発に注力した。推定対象が膨大な数になることが多いスパースモデリングは近年盛んに研究・応用されているが、モデル選択に於いては仮定に合わない従来手法や頑健性の乏しい規準が未だ多く使われている現状がある。本研究では、LASSOやSCAD等のスパース正則化が持つ推定の優れた漸近性質を保ったまま、頑健に変数選択を実行可能な正則化項及び選択規準を提案した。
|