研究課題
基盤研究(C)
得られた経験を強く強化する機械学習手法である「経験強化型学習XoL」の発展として、「複数種類の報酬と罰を扱える手法」を完成させるとともに、応用の際に特に重要となる「報酬と罰の設計指針」の提示に成功した。具体的な応用例として、「科目の分類を支援する実システム」、「2足歩行ロボットの腰軌道学習」および「Keepawayタスクと呼ばれるサッカーを模したゲーム問題」への適用を行った。これらの成果により、伝統的な強化学習手法に対するXoLの優位性を強く主張できたと考える。
すべて 2012 2011 2010 その他
すべて 雑誌論文 (3件) (うち査読あり 2件) 学会発表 (3件) 図書 (1件) 備考 (1件)
計測と制御
巻: Vol.52, No.5 ページ: 462-467
Journal of Advanced Computational Intelligence and Intelligent Informatics
巻: Vol.16, No.6 ページ: 758-768
巻: Vol.16, No.2 ページ: 183-190
http://svrrd2.niad.ac.jp/faculty/teru/x of s. html