本研究課題では、マルチエージェント学習における経験強化型学習XoLに関する発展的研究を行った。特に、平成28年度においては、当初の予定通り、マルチエージェント学習におけるXoLの有効性を示すための応用例の拡充を図った。 特に、Keepaway Taskとして呼ばれるサッカーゲームを模したマルチエージェント環境への応用を行った。具体的には、「International Workshop on Multiagent Learning: Theory and Applications」において、サッカーロボットに関するプロトタイプ的な手法を提案するとともに、「14th European Conference on Multi-Agent Systems」においては、それをさらに発展・拡充させた「Proposal of an Action Selection Strategy with Expected Failure Probability and its Evaluation in Multi-agent Reinforcement Learning」という題目の発表を行った。 また、近年、深層学習が大きな広がりをみせているので、深層学習を利用した応用例として、「電気学会 システム研究会」において、ATARI 2600ゲームを題材とした研究発表を行った。そこでは、Deep Q-Networkとして知られる既存手法にXoLの一手法であるProfit Sharingを組み合わせことで、大幅なる性能の改善を実現した。なお、本成果はシングルエージェント環境下のものであるが、現在は、本研究課題の目的であるマルチエージェント環境下への適用を進めている。特に、Palro、Rapiro、LEGOロボット等の異なる種類のロボットにより構成されるマルチロボット環境下への意識的意思決定システムの実装を中心に研究を進めている。
|