研究概要 |
サポートベクターマシンの汎化誤差に関する代数的な観点からの考察は一段落し,論文としてまとめることができた.今後の課題としてはより複雑なモデルへ今回提案した解析手法を適応することと実問題での性能の評価等が考えられる. また,集団学習に関しては以下の2つの課題に取り組んだ. まず,実問題にグラフィカルモデルやベイジアンネットを適用する場面で必要とされる巨大な確率分布表の推定におけるパラメタ数の爆発という問題に対して,これを回避するために集団学習の原理を応用し,独立な同時分布表の混合することによってパラメタ数をドラスティックに削減し,大規模でありながら比較的パラメタ数が少数で推定に用いる例題数が少なくても汎化能力を損わない確率モデルを構成した.モデルの推定にはブースティングの解析のために提案したブレグマンダイバージェンスにもとづく情報幾何的な方法を応用してEMアルゴリズムを拡張し,また,このモデルと採用するダイバージェンスの関係に由来するロバスト性について考察した.もうひとつは,ブースティングを,強化学習などのオンライン性が必要とされる学習方法と組み合わせて利用するために,ブースティングアルゴリズムのオンライン化に取り組んだ.前年度までに行なった理論解析の結果にもとづき,アルゴリズムの中で最適化が行われている評価関数を逐次的に得られるデータから構成していく基礎的な方法を考察し,オフラインである従来のブースティングとの比較・検討を行った.より複雑な状況にも対応できるような改良も必要であるが,今後はボードゲームなどの強化学習に適用することによって,より実用的なアルゴリズムの構築を目指す.
|