ダイバージェンスに基づくロバストな一般化ベイズ法に関する研究
Project/Area Number |
23K13019
|
Research Category |
Grant-in-Aid for Early-Career Scientists
|
Allocation Type | Multi-year Fund |
Review Section |
Basic Section 12040:Applied mathematics and statistics-related
|
Research Institution | Meisei University |
Principal Investigator |
中川 智之 明星大学, データサイエンス学環, 准教授 (70822526)
|
Project Period (FY) |
2023-04-01 – 2027-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2026: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Fiscal Year 2025: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2024: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
|
Keywords | 頑健性 / WLB / 一般化ベイズ法 / 一般化事後分布 / ダイバージェンス / ロバスト統計 / ベイズ統計 / 漸近論 |
Outline of Research at the Start |
本研究は大規模データに現れる外れ値やモデルの誤特定の問題を解決する研究である. 特に, 本研究ではダイバージェンスとベイズ統計を組み合わせることでロバストな解析手法を開発する. また, 高次元データなどの複雑なデータに関して, 漸近的な振る舞いを調べることで, 外れ値などの影響を近似的に導出する. また大規模データへの適用も可能な数値計算アルゴリズムを構築する。
|
Outline of Annual Research Achievements |
本年は、方向データや順序回帰分析などの具体的な問題におけるロバストなベイズ推論について、実装とロバスト性の理論的性質について研究を行った。また、漸近的な性質について幾つかの結果を調べた。特に, 本年はガンマ・ダイバージェンスを用いた一般化事後分布からのサンプリングをvon Mises-Fisherモデルや順序回帰モデルで可能にするように実装部分の研究を行い, さらにロバスト性を数値実験などを用いて調べた. von Mises-Fisherモデルの場合には、当初はstanによる実装を考えていたが、特殊関数を含むモデルであったことからstanでの実装が難しくなり、Weighted loss-likelihood bootstrapによるサンプリングの近似を行った。また数値実験を用いてロバストな推定結果を得ることができた。さらに、大標本漸近理論の下でのBernstein-von Mises theoremの証明などを行い、漸近的な挙動を調べた。 方向データやカテゴリカルデータのようにデータの値が有限の場合には外れ値を大きくする漸近論を用いたロバスト性の保証が意味がない。このような場合の多くはStandardized Gross Error Sensitivityが有界であるSB-robsut性が重要である。本研究ではダイバージェンスがこのSB-robust性を満たすのかを現在調べている。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ガンマ・ダイバージェンスを用いた一般化事後分布のWLBを用いた実装は非常に順調に進んでいる。現在はさらに拡張し、正確に積分項が計算できる場合だけでなく、積分項が計算できない場合でも実装できるように手法を考えている。また影響関数の導出なども順調に行えている。一方で、ダイバージェンスを用いた場合は、影響関数の形が複雑になりがちであり、さまざまなダイバージェンスに統一的な条件を考えるのが非常に難しくなっている。 また、同様に事後分布のロバスト性についても一般的な条件を出すに苦労をしている。しかしながら、最近のディスカションにより、一般的な条件に落とすことが可能になりそうなことがわかっており、解決も近いと考える。
|
Strategy for Future Research Activity |
今後は、ガンマ・ダイバージェンスを用いた一般化事後分布及びより使いやすいダイバージェンスや損失関数を用いた一般化事後分布のPosterior Robustnessについて、議論をしていく。またベイズ版の影響関数を導出し、Standardized Gross Error Sensitivityが有界性を調べ、SB-robsut性が成り立つかを調べる。さらにPosterior RobustnessとSB-robust性の関係についても調べていく予定である。 また、実装面では確率的最適化を用いた実装を行い、積分項を含む損失関数を用いた一般化事後分からのサンプリングにも取り組む。さらに、実用的な問題として、ハイパーパラメータの選択があり、Iba and Yano (2022)などで提案されているPCICなどの情報量規準を用いた選択について、実装してく予定である。 また、情報幾何的な観点からこれらのロバストな一般化事後分布が特徴付けられるかを考える。
|
Report
(1 results)
Research Products
(9 results)