研究課題
基盤研究(C)
マルチエージェント学習における経験強化型学習XoLに関する発展的研究として、複数のエージェントが同時に学習することによって生じる同時学習問題を回避する手法を提案した。また、マルチエージェント学習における間接報酬の正の効果の解析を行った。具体的には、「間接報酬により不完全知覚問題を軽減する手法」を提案するとともに、「全エージェントが報酬を得るための定理」としてのとりまとめを行った。さらに、Keepawayタスク等への適用を通じて、マルチエージェント学習におけるXoLの有効性を示すための応用例の拡充を図った。これらの成果により、マルチエージェント学習におけるXoLの優位性を強く主張できたと考える。
すべて 2016 2015 2014 その他
すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 3件、 謝辞記載あり 2件) 学会発表 (16件) (うち国際学会 3件、 招待講演 1件) 図書 (1件) 備考 (1件)
Procedia Computer Science
巻: 88 ページ: 94-101
10.1016/j.procs.2016.07.411
40020804252
電気学会論文誌C(電子・情報・システム部門誌)
巻: 136 号: 3 ページ: 273-281
10.1541/ieejeiss.136.273
130005132275
International Journal of Machine Learning and Computing
巻: 5 (2) 号: 2 ページ: 121-126
10.7763/ijmlc.2015.v5.494
巻: 41 ページ: 15-22
10.1016/j.procs.2014.11.079
http://www7b.biglobe.ne.jp/~kazuteru/indexj.html