研究課題/領域番号 |
23K13019
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分12040:応用数学および統計数学関連
|
研究機関 | 明星大学 |
研究代表者 |
中川 智之 明星大学, データサイエンス学環, 准教授 (70822526)
|
研究期間 (年度) |
2023-04-01 – 2027-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2026年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2025年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2024年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2023年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 頑健性 / WLB / 一般化ベイズ法 / 一般化事後分布 / ダイバージェンス / ロバスト統計 / ベイズ統計 / 漸近論 |
研究開始時の研究の概要 |
本研究は大規模データに現れる外れ値やモデルの誤特定の問題を解決する研究である. 特に, 本研究ではダイバージェンスとベイズ統計を組み合わせることでロバストな解析手法を開発する. また, 高次元データなどの複雑なデータに関して, 漸近的な振る舞いを調べることで, 外れ値などの影響を近似的に導出する. また大規模データへの適用も可能な数値計算アルゴリズムを構築する。
|
研究実績の概要 |
本年は、方向データや順序回帰分析などの具体的な問題におけるロバストなベイズ推論について、実装とロバスト性の理論的性質について研究を行った。また、漸近的な性質について幾つかの結果を調べた。特に, 本年はガンマ・ダイバージェンスを用いた一般化事後分布からのサンプリングをvon Mises-Fisherモデルや順序回帰モデルで可能にするように実装部分の研究を行い, さらにロバスト性を数値実験などを用いて調べた. von Mises-Fisherモデルの場合には、当初はstanによる実装を考えていたが、特殊関数を含むモデルであったことからstanでの実装が難しくなり、Weighted loss-likelihood bootstrapによるサンプリングの近似を行った。また数値実験を用いてロバストな推定結果を得ることができた。さらに、大標本漸近理論の下でのBernstein-von Mises theoremの証明などを行い、漸近的な挙動を調べた。 方向データやカテゴリカルデータのようにデータの値が有限の場合には外れ値を大きくする漸近論を用いたロバスト性の保証が意味がない。このような場合の多くはStandardized Gross Error Sensitivityが有界であるSB-robsut性が重要である。本研究ではダイバージェンスがこのSB-robust性を満たすのかを現在調べている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
ガンマ・ダイバージェンスを用いた一般化事後分布のWLBを用いた実装は非常に順調に進んでいる。現在はさらに拡張し、正確に積分項が計算できる場合だけでなく、積分項が計算できない場合でも実装できるように手法を考えている。また影響関数の導出なども順調に行えている。一方で、ダイバージェンスを用いた場合は、影響関数の形が複雑になりがちであり、さまざまなダイバージェンスに統一的な条件を考えるのが非常に難しくなっている。 また、同様に事後分布のロバスト性についても一般的な条件を出すに苦労をしている。しかしながら、最近のディスカションにより、一般的な条件に落とすことが可能になりそうなことがわかっており、解決も近いと考える。
|
今後の研究の推進方策 |
今後は、ガンマ・ダイバージェンスを用いた一般化事後分布及びより使いやすいダイバージェンスや損失関数を用いた一般化事後分布のPosterior Robustnessについて、議論をしていく。またベイズ版の影響関数を導出し、Standardized Gross Error Sensitivityが有界性を調べ、SB-robsut性が成り立つかを調べる。さらにPosterior RobustnessとSB-robust性の関係についても調べていく予定である。 また、実装面では確率的最適化を用いた実装を行い、積分項を含む損失関数を用いた一般化事後分からのサンプリングにも取り組む。さらに、実用的な問題として、ハイパーパラメータの選択があり、Iba and Yano (2022)などで提案されているPCICなどの情報量規準を用いた選択について、実装してく予定である。 また、情報幾何的な観点からこれらのロバストな一般化事後分布が特徴付けられるかを考える。
|