研究課題
基盤研究(C)
得られた経験を強く強化する機械学習手法である「経験強化型学習XoL」の発展として、「複数種類の報酬と罰を扱える手法」を完成させるとともに、応用の際に特に重要となる「報酬と罰の設計指針」の提示に成功した。具体的な応用例として、「科目の分類を支援する実システム」、「2足歩行ロボットの腰軌道学習」および「Keepawayタスクと呼ばれるサッカーを模したゲーム問題」への適用を行った。これらの成果により、伝統的な強化学習手法に対するXoLの優位性を強く主張できたと考える。
すべて 2013 2012 2011 2010 その他
すべて 雑誌論文 (19件) (うち査読あり 11件) 学会発表 (14件) 図書 (2件) 備考 (3件)
Journal of Computers
巻: 印刷中
計測と制御
巻: Vol.52, No.5
第40回知能システムシンポジウム資料
巻: なし ページ: 319-324
巻: Vol.52, No.5 ページ: 462-467
Journal of Advanced Computational Intelligence and Intelligent Informatics
巻: Vol.16, No.6 ページ: 758-768
巻: Vol.16, No.2 ページ: 183-190
Lecture Notes in Computer Science
巻: Vol.7188 ページ: 333-344
10.1007/978-3-642-29946-9_32
巻: Vol.7188 ページ: 297-308
10.1007/978-3-642-29946-9_29
Proc. of the 2nd International Conference on Applied and Theoretical Information Systems Research (2nd ATIRSR)
巻: なし
Proc. of the 6th International Conference on Soft Computing and Intelligent Systems and the 13th International Symposium on Advanced Intelligent Systems (SCIS-ISIS 2012)
巻: なし ページ: 1520-1527
平成24年 電気学会 電子・情報・システム部門大会 講演論文集
巻: なし ページ: 559-564
第39回知能システムシンポジウム資料
ページ: 95-98
第21回インテリジェント・システム・シンポジウム講演原稿集
120005566631
第38回知能システムシンポジウム予稿集
ページ: 123-128
Proceedings of the 11th International Conference on Intelligent Data Engineering and Automated Learning
ページ: 178-185
Proceedings of the SICE Annual Conference 2010
ページ: 3240-3245
ページ: 3246-3249
第53回自動制御連合講演会論文集
ページ: 4-4
130005025728
http://svrrd2.niad.ac.jp/faculty/teru/xol_s.html