研究課題
若手研究(B)
試行錯誤のさなかに報酬が変化する環境において、変化に関する事前知識を活用した効率的な強化学習方法を実現することである。強化学習には、多くの潜在的アプリケーションが期待されている反面、「ある行動を選択することの望ましいは時間に対して不変である」という仮定があり、時間とともに性質が変化する対象を学習できないという本質的な課題がある。本研究では、この実現の切り口として、変化に関する事前知識を活用した手法について研究を進めた。環境にあわせた事前知識を用いて、時間に対して報酬が周期性を持つ環境、方位に対して報酬が周期性を持つ環境、状態遷移確率が変化する環境などのための学習方式を明らかにした。
すべて 2015 2014 2013 2012
すべて 雑誌論文 (7件) (うち査読あり 6件、 謝辞記載あり 2件) 学会発表 (10件)
Proceedings of the 10th Asian Control Conference 2015 (ASCC 2015)
巻: ASCC2015
Proceedings on the 16th International Symposium on Advanced Intelligent Systems
巻: ISIS2015 ページ: 1091-1098
Proceedings of the 10th Asian Control Conference 2015
電気学会 論文誌C
巻: 134-9 ページ: 1325-1332
130004684941
電子情報通信学会論文誌 D
巻: J98-D ページ: 287-299
110008746501
Proceedings of Joint 7th International Conference on Soft Computing and Intelligent Systems and 15th International Symposium on Advanced Intelligent Systems
巻: SCIS&ISIS2014 ページ: 801-806
USB Proceedings of the 11th International Conference on Modeling Decisions for Artificial Intelligence
巻: MDAI2014 ページ: 143-152