2016 Fiscal Year Annual Research Report
Theory and Applications of Exploitation-oriented Learning XoL in Multi-agent Systems
Project/Area Number |
26330267
|
Research Institution | National Institution for Academic Degrees and Quality Enhancement of Higher Education |
Principal Investigator |
宮崎 和光 独立行政法人大学改革支援・学位授与機構, 研究開発部, 准教授 (20282866)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | マルチエージェントシステム / 経験強化型学習 / 強化学習 / 機械学習 / 人工知能 / 深層学習 / ソフトコンピューティング |
Outline of Annual Research Achievements |
本研究課題では、マルチエージェント学習における経験強化型学習XoLに関する発展的研究を行った。特に、平成28年度においては、当初の予定通り、マルチエージェント学習におけるXoLの有効性を示すための応用例の拡充を図った。 特に、Keepaway Taskとして呼ばれるサッカーゲームを模したマルチエージェント環境への応用を行った。具体的には、「International Workshop on Multiagent Learning: Theory and Applications」において、サッカーロボットに関するプロトタイプ的な手法を提案するとともに、「14th European Conference on Multi-Agent Systems」においては、それをさらに発展・拡充させた「Proposal of an Action Selection Strategy with Expected Failure Probability and its Evaluation in Multi-agent Reinforcement Learning」という題目の発表を行った。 また、近年、深層学習が大きな広がりをみせているので、深層学習を利用した応用例として、「電気学会 システム研究会」において、ATARI 2600ゲームを題材とした研究発表を行った。そこでは、Deep Q-Networkとして知られる既存手法にXoLの一手法であるProfit Sharingを組み合わせことで、大幅なる性能の改善を実現した。なお、本成果はシングルエージェント環境下のものであるが、現在は、本研究課題の目的であるマルチエージェント環境下への適用を進めている。特に、Palro、Rapiro、LEGOロボット等の異なる種類のロボットにより構成されるマルチロボット環境下への意識的意思決定システムの実装を中心に研究を進めている。
|
Research Products
(8 results)