研究成果の概要 |
大規模なデータを扱う際には, 外れ値やモデルの誤特定の問題は非常に深刻である. 外れ値はデータ生成過程からは大きく外れたデータであり, 推論に大きな影響を与える. 一方で, 外れ値はモデルの誤特定を示唆している場合があり, 外れ値を扱いは重要である. ベイズ統計においてもモデル誤特定や外れ値の混在の問題は古くから議論されている. 本研究では, 外れ値に影響されにくいベイズ法の開発とその理論的性質について研究を行った. 具体的にはダイバージェンスと呼ばれる分布間の擬距離を用いてロバストなベイズ推定を構築し, MCMCなどを用いて推論を行う際の漸近的性質を導出した.
|
研究成果の学術的意義や社会的意義 |
近年は膨大な数のデータが取れるため, その中から外れ値を見つけることは大変困難である. また外れ値に影響されるような手法は, しばしば誤った解析結果を誘導することがある. 一方で外れ値を含む場合は仮定したモデルが誤っている可能性もあるため, 外れ値の扱いは重要である. 特に外れ値に影響を受けにくい解析は, 現在のモデルとデータで説明できる部分の結果を返してくれる. そのため本研究は, データに外れ値が含まれていても影響を受けにくいベイズ法とその理論的性質の導出を行ったことで, 推定だけでなく予測や不確実性の評価も外れ値の影響を受けにくくすることができる.
|