研究概要 |
本年度はロバスト推測の方を集中的に研究した.過去のロバスト推測は外れ値の割合が十分に少ないということが前提であった.その後に,外れ値のもつ性質に基づいた議論が進められた.本研究では,外れ値のもつ性質が何であるかを十分に定式化し,それを前提に考えると,外れ値の割合が少なくなくても十分にロバスト推測が可能である,ということを示した.これはロバスト推測が考案されて20年ほど見つからなかった考え方であり,ロバスト推測自体のパラダイムを大きく変換することになると考えている. 外れ値の存在を想定するとき,データは,目的とした分布から発生したものと,外れ値を生成する何らかの分からない分布から発生したものとに分類することができる.このときに,外れ値を生成する分布は分からないが,データが外れ値であるとき,何故か認識できることが一般的である.それは目的分布から見て外れ値の生成確率が低いと認識できるからである.これをきちんと定式化することが重要であった. さらに,外れ値が何であるかが定式化できても,その定式化に基づいて,外れ値の悪い影響を自動的に除外するための構造が方策である.それを実行するために特殊なダイバージェンスを用意した.外れ値の割合が少ないときにロバスト推測に役に立つダイバージェンスは,最近になって既に幾つか提案されていたが,本研究では,外れ値の定式化に着目して特殊なダイバージェンスを用意した.そのダイバージェンスは,外れ値の割合が少なくなくても妥当な推測を可能にした,特に,過去の話では推定が主であったが,本研究で採用したダイバージェンスは,統計学で頻繁に使われているモデル選択基準のロバスト化の可能性を広げることができる. 加えて,数値例では,多くの研究者が驚くほどに良い性能を示している.今までのロバスト推測法は,外れ値の影響を取り除いてはいてもシャープさに大きく欠けていた.ところが,今回提案している方法は,外れ値の影響を取り除きながら,同時に,そのシャープさに磨きをかけている.
|