配分額 *注記 |
7,000千円 (直接経費: 7,000千円)
2005年度: 800千円 (直接経費: 800千円)
2004年度: 1,200千円 (直接経費: 1,200千円)
2003年度: 3,200千円 (直接経費: 3,200千円)
2002年度: 1,800千円 (直接経費: 1,800千円)
|
研究概要 |
ブースティングの統計的な性質を考察するために,ブレグマン情報量に基づいて自然に導入される一般的な学習モデルの空間構造を,情報幾何学の枠組みにおいて考察した.雑音やはずれ値に対する頑健性,学習データとモデルの大きさに依存する漸近有効性,ブレグマン情報量を誘導する凸関数のベイズ最適性と一致性など,新たな観点からブースティングの統計的な性質を議論し明らかにした.また,上記の考察に基づき,より一般的なU-Boostアルゴリズムを提案した. さらに提案した手法を密度推定に拡張することによって,回帰問題に対するアルゴリズムの提案も行っている.これは再生核ヒルベルト空間を利用したガウス過程を回帰曲線とするq正規過程モデルに対してブレグマン情報量基づく損失関数を最小化する推定方程式を構成するものである. また,解析する中で,集団学習がSupport Vector Machine(SVM)などと密接に関係することが明らかとなってきたため,SVMの汎化誤差に関する統計的考察を代数的・幾何学的な観点から進めた. また,応用に向けては以下の2つの課題に取り組んだ. まず,ベイジアンネットワークで必要とされる巨大な確率分布表の推定において,オーバーフィットの問題を回避するために集団学習の原理を応用し,複数の単純な表を混合することによってパラメタ数を削減しつつ汎化能力を損わない確率モデルを構成した.モデルの推定には情報幾何的な観点からEMアルゴリズムの拡張を提案した. もう一つは,強化学習などのオンライン性が必要とされる学習方法と組み合わせて利用するためにブースティングのオンライン化に取り組んだ.理論解析の結果にもとづき,逐次的に得られるデータから最適化すべき評価関数を構成していく基礎的な方法を考察し,従来のブースティングとの比較・検討を行った.
|