研究概要 |
既存のデータから将来のデータの予測を行う問題を考える.予測を構成するための候補となるモデルが複数あるとき,モデル選択を行ったあと,選ばれたモデルを用いて予測を行う方法と,複数のモデルを組み合わせて予測を行う方法が考えられる.本研究では,モデル選択と複数のモデルを組み合わせて予測を行う方法の比較をった.モデルを組み合わせて予測をうには,モデル平均の方法やスタッキングと呼ばける方法が代表的なものとして知られている.非常に特別な場合を除けば,一般には、候補のモデルの中に真の分布が含まれないような状況が適切だと考えられるめ,本研究では,候補のモデルの中に真の分布が含まれないような状況が適切だと考えられるため,本研究では,候補のモデルの中に真の分布が含もれない設定で議論を行い,その場合には,データ数が大きくなると,モデル選択やモデル平均を用いた予測よりもスタッキングを行ってモデルを拡大した方がよい予測が得られることがわかった.一般に,スタッキングを用いてモデルを組み合わせる場合には,正則化が必要となる.正則化パラメータを選択する方法の代表的なものとしてクロス・ヴァリデーションが考えられるが,スタッキングの正則化パラメータを選択する際にクロス・ヴァリデーションを適用しようとすると,非常に多くの計算が必要となるという問題点が生じることがわかった.そのため本研究では,スタッキングにおける正則化パラメータ選択の計算負荷を軽減する方法を考えた.具体的には,クロス・ヴァリデーションを近似する方法を提案し,いくつかの数値実験を行って提案手法の有効性を確かめた.
|