研究概要 |
教師付き学習の目的は,入出力の組からなる訓練データを用いて,その背後に潜む規則を推定することである.規則がうまく獲得できれば,学習機械は「汎化能力」を持つ.高い汎化能力を得るためには学習機械の構造(モデル)を適切に決定する必要がある.モデル選択の目的は,汎化能力が最大になるようにモデルを選ぶことである.しかしながら直接的には汎化能力の度合いはわからないため,与えられた訓練データだけから汎化能力の「よさ」を推定しなければならない.従って,モデル選択研究の本質は,どれだけ精度良く汎化能力を推定できるかにある.一般に汎化能力推定法のよさは,平均的に精度良く汎化能力を推定できるかどうか,即ち不偏性で評価する.これまで,訓練データの入力と出力両方に関する期待値の意味で平均的に精度良く汎化能力を推定する方法が提案されてきた.本研究では訓練入力に関して平均を取らずに汎化能力を推定する方法を開発する. 本年度は,訓練入力に関して平均を取らずに学習機械の汎化能力を推定するための数理的な枠組みを構築した.具体的には,これまでに研究代表者が中心となって提案してきた関数解析的モデル選択理論の枠組みを再構築し,訓練入力に関して平均を取らずに汎化能力を評価するためにふさわしい形の枠組みを築いた.その際,従来の学習研究の枠組みとの関係を明らかにした. また,来年度以降の研究ではラベル無しデータを汎化誤差推定に活用する予定である.従来の教師付き学習の手法,および,汎化誤差推定の手法の問題点を洗い出し,それらを解決するために必要な数理的な基盤を整備した.
|