研究課題/領域番号 |
15K00331
|
研究機関 | 東京工業大学 |
研究代表者 |
渡邊 澄夫 東京工業大学, 総合理工学研究科, 教授 (80273118)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 代数幾何 / 汎化誤差 / 周辺尤度 / WAIC / WBIC |
研究実績の概要 |
統計学および機械学習において用いられている確率モデルや事前分布の適切さを合理的に評価する量として汎化誤差と周辺尤度が知られている.汎化誤差は予測を行う時の誤差の大きさであり、周辺尤度は確率モデルと事前分布の尤度を表している.我々はこれまでの研究において、事後分布が正規分布で近似できない場合であっても汎化誤差と周辺尤度を求めることができる公式を代数幾何学的な理論を構築することにより導出してきた.汎化誤差と周辺尤度はどちらも大切な量であるが、事後分布が正規分布で近似できる場合であっても、その数学的な性質は大きく異なることが知られている.本研究では,事後分布が正規分布で近似できない場合における両者の違いを数学的に解明し,現実の確率モデルの評価に適用できるようにすることを目的としている. 平成27年度には次の研究を行った.まず,クロスバリデーションとWAICとを用いて事前分布を最適化した場合に,最適化された事前分布は平均汎化誤差および汎化誤差を漸近的に最小化するかという問題を研究し,次の結論を得た.クロスバリデーションおよびWAICによる事前分布の最適化は漸近的に等価であり,平均汎化誤差を漸近的に最小化するが、確率変数としての汎化誤差を最小にはしない.次にレプリカモンテカルロ法を用いて対数周辺尤度を求めたとき,その値の真の値からのずれにはどのような性質があるかという問題を研究し,次の結論を得た.対数周辺尤度の数値の精度は代数幾何学的な方法で真の値を求めることで計算することができ,モンテカルロパラメータ数の平方根に逆比例し,レプリカ温度数の指数乗に比例する.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究実績の概要で述べたように,汎化誤差および周辺尤度の挙動について基本的な性質が解明できた.
|
今後の研究の推進方策 |
汎化誤差については,事後分布がハイパーパラメータの制御に対して相転移を持つ場合についてはまだ解明できていないので,今後はその場合も含めて考察したい.また周辺尤度については,導出できた公式についての理論的基盤が脆弱であるため,今後は数学的に強固な基礎づくりを行いたい.
|