研究課題/領域番号 |
19K14597
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分12040:応用数学および統計数学関連
|
研究機関 | 東京理科大学 |
研究代表者 |
中川 智之 東京理科大学, 理工学部情報科学科, 嘱託特別講師 (70822526)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2021年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2020年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2019年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | ベイズ統計 / ロバスト統計 / 漸近理論 / カテゴリカルデータ / 一般化事後分布 / Outlier Rejection / 影響関数 / MCMC / ロバスト推定 / 時系列 / Objective prior / quasi-Bayes / general Bayes / Asymptotic expansion / 擬似ベイズ法 / 漸近論 / 客観ベイズ法 |
研究開始時の研究の概要 |
近年, 計算機の発達により大規模なデータ多く収集でき, さらに解析が可能になってきた. しかしながら, それらの大量のデータの多くは入力ミスやノイズなどの外れ値というものを多く含むものが多い. 外れ値などが含まれると通常の統計解析の結果は大きく変化してしまい, 妥当性が損なわれる. そのため本研究では外れ値に影響されにくい, 頑健な統計解析手法を開発する必要がある. 本研究では擬似ベイズ法という近年注目を集めている方法に着目し, その手法を用いて頑健な統計解析方法の提案と妥当性を保証する研究を行なっている.
|
研究成果の概要 |
大規模なデータを扱う際には, 外れ値やモデルの誤特定の問題は非常に深刻である. 外れ値はデータ生成過程からは大きく外れたデータであり, 推論に大きな影響を与える. 一方で, 外れ値はモデルの誤特定を示唆している場合があり, 外れ値を扱いは重要である. ベイズ統計においてもモデル誤特定や外れ値の混在の問題は古くから議論されている. 本研究では, 外れ値に影響されにくいベイズ法の開発とその理論的性質について研究を行った. 具体的にはダイバージェンスと呼ばれる分布間の擬距離を用いてロバストなベイズ推定を構築し, MCMCなどを用いて推論を行う際の漸近的性質を導出した.
|
研究成果の学術的意義や社会的意義 |
近年は膨大な数のデータが取れるため, その中から外れ値を見つけることは大変困難である. また外れ値に影響されるような手法は, しばしば誤った解析結果を誘導することがある. 一方で外れ値を含む場合は仮定したモデルが誤っている可能性もあるため, 外れ値の扱いは重要である. 特に外れ値に影響を受けにくい解析は, 現在のモデルとデータで説明できる部分の結果を返してくれる. そのため本研究は, データに外れ値が含まれていても影響を受けにくいベイズ法とその理論的性質の導出を行ったことで, 推定だけでなく予測や不確実性の評価も外れ値の影響を受けにくくすることができる.
|