研究課題/領域番号 |
21K12025
|
研究機関 | 東京工業大学 |
研究代表者 |
渡邊 澄夫 東京工業大学, 情報理工学院, 教授 (80273118)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | WBIC / 特異モデル / 実対数閾値 / 調整された交差検証 / 調整された情報量規準 |
研究実績の概要 |
統計学と学習理論において不確実性は未知であり、科学的な分析を行うユーザーは自身が作成した確率モデルと事前分布がデータの生成過程とは異なる架空の候補にすぎないことに気づいている。すなわち、現代の統計的分析においては確率モデルと事前分布の妥当性を評価しチェックを行うことは必須となる手続きであるが、そのための数学的な基盤は未だに十分には確立されていない。 確率モデルと事前分布の評価を行うための指標として代表的なものに自由エネルギー(マイナス対数周辺尤度、確率的複雑さ)、交差検証、情報量規準がある。自由エネルギーによるモデル評価は、モデル族の中にデータ生成分布が含まれているときには良好であることが知られているが、汎化誤差を推定するという観点からはバイアスとバリアンスのバランスが適切でないという問題点がある。一方、交差検証と情報量規準は汎化誤差の漸近的な不偏推定を与えるが、汎化誤差と逆相関を持つという問題点があることが知られていた。 2022年度の研究では、交差検証と情報量規準の数学的な性質に基づいて、汎化誤差の漸近的な不偏推定量であり、かつ、汎化誤差と逆相関を持たない推定量である調整された交差検証と情報量規準を構成し、汎化誤差の推定量としての二乗誤差が交差検証や情報量規準よりも小さくなることを理論的に明らかにした。また行列分解などの事後分布が正規分布で近似できない特異モデルにおいても、良好な汎化誤差の推定ができることを実験的に確認した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
汎化誤差の漸近的な不偏推定量であり汎化誤差と逆相関を持たない調整された交差検証と調整された情報量規準を創出し、その数学的な特性を明らかにし、特異な統計モデルとして具体的な行列分解において、その有効性を実験的に示すことができた。
|
今後の研究の推進方策 |
汎化誤差の漸近的な不偏推定量として、分散が交差検証や情報量規準よりも小さいものが存在することを示すことができたが、自由エネルギーとの関連やモデル選択やハイパーパラメータ調整などにおける有効性を調べることについては今後の課題である。理論および実験の両面からこれらの問題を考察して行く。
|