マルチエージェント学習における経験強化型学習XoLに関する発展的研究として、複数のエージェントが同時に学習することによって生じる同時学習問題を回避する手法を提案した。また、マルチエージェント学習における間接報酬の正の効果の解析を行った。具体的には、「間接報酬により不完全知覚問題を軽減する手法」を提案するとともに、「全エージェントが報酬を得るための定理」としてのとりまとめを行った。さらに、Keepawayタスク等への適用を通じて、マルチエージェント学習におけるXoLの有効性を示すための応用例の拡充を図った。これらの成果により、マルチエージェント学習におけるXoLの優位性を強く主張できたと考える。
|