研究課題
基盤研究(C)
高次元の連続状態空間を直接扱うことのできるモデル追加型の強化学習アルゴリズムを開発した。このアルゴリズムの最大の特徴は、関数近似器のパラメータをうまく設定することで、モデル数を小さく抑えつつも良好な学習性能を実現できる点にある。このため、まず、パラメータの挙動解析を行い、最良のパラメータを見出した。つぎに、10次元の連続状態空間をもつ移動ロボットの移動障害物回避問題に適用し、有効性を確認した。
すべて 2009 2008 2007
すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (4件)
八戸工業高等専門学校紀要 43号
ページ: 65-68
八戸工業高等専門学校紀要 42号