研究概要 |
教師付き学習の目的は,入出力の組からなる訓練データを用いて,その背後に潜む規則を推定することである.規則がうまく獲得できれば,学習機械は「汎化能力」を持つ.高い汎化能力を得るためには学習機械の構造(モデル)を適切に決定する必要がある.モデル選択の目的は,汎化能力が最大になるようにモデルを選ぶことである.しかしながら直接的には汎化能力の度合いはわからないため,与えられた訓練データだけから汎化能力の「よさ」を推定しなければならない.従って,モデル選択研究の本質は,どれだけ精度良く汎化能力を推定できるかにある.一般に汎化能力推定法のよさは,平均的に精度良く汎化能力を推定できるかどうか,即ち不偏性で評価する.これまで,訓練データの入力と出力両方に関する期待値の意味で平均的に精度良く汎化能力を推定する方法が提案されてきた.本研究では訓練入力に関して平均を取らずに汎化能力を推定する方法を開発する. 昨年度は,訓練入力に関して平均を取らずに学習機械の汎化能力を推定するための数理的な枠組みを構築した.本年度は,この枠組みのもと,ラベルなしデータを汎化誤差推定に活用するための数理的な基盤を構築した.そして,共変量シフトと呼ばれる,訓練入力とテスト入力の分布が異なる場面に対するモデル選択法の基礎理論を構築した.
|