研究課題
基盤研究(C)
短時間で最適な方策を学習するために、Particle Swarm Optimization(PSO)に基づく群強化学習法を提案し、連続状態行動空間を有する問題などの複雑な強化学習問題に提案方法を適用した。提案方法はエージェントと環境の組(これを学習世界と呼ぶ)を複数用意し、各学習世界のエージェントが個別に通常の強化学習法を用いて学習を行うとともに、PSO の更新式を用いた学習世界間の情報交換による学習も行う方法である。
すべて 2013 2012 2011 2010
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (5件)
計測自動制御学会論文集
巻: 48巻 ページ: 790-798
DOI:10.9746/sicetr.48.790
Proceedings of 2012 IEEE International Conference on Systems, Man and Cybernetics
ページ: 1917-1923
DOI:10.1109/ICSMC.2012.6378018
Proceedings of 2011 IEEE International Conference on Systems, Man and Cybernetics
ページ: 2173-2180
DOI:10.1109/ICSMC.2011.6083999
Proceedings of Eighth International Conference on Simulated Evolution and Learning
DOI:10.1007/978-3-642-17298-4_29