研究課題
基盤研究(C)
複数のエージェントが同時学習する際に生じるジレンマに起因する系の不安定を解決するため、エージェント学習の環境変化に対する不感度とエージェントの受ける情報配信のバランスを制御する方法を開発した。その結果、強化学習のステップサイズパラメータを自動的に制御するRASPや学習におけるExploration/Exploitationを調整する方法を始め、エージェント学習の制御パラメータを制御して系の安定さを向上させる手法を導出・提案した。
すべて 2012 2011 2010 2009
すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (17件) 図書 (1件)
AGENTS IN PRINCIPLE, AGENTS IN PRACTICE
巻: Vol.7047 ページ: 349-360
DOI:10.1007/978-3-642-25044-6_28
Proc. of Adaptive and Learning Agents
人工知能学会誌
巻: Vol.25 ページ: 183-188
Principles of Practice in Multi-Agent Systems
巻: Vol.1 ページ: 525-533
DOI:10.1007/978-3-642-11161-7_38