Research Project
Grant-in-Aid for Scientific Research (C)
高次元の連続状態空間を直接扱うことのできるモデル追加型の強化学習アルゴリズムを開発した。このアルゴリズムの最大の特徴は、関数近似器のパラメータをうまく設定することで、モデル数を小さく抑えつつも良好な学習性能を実現できる点にある。このため、まず、パラメータの挙動解析を行い、最良のパラメータを見出した。つぎに、10次元の連続状態空間をもつ移動ロボットの移動障害物回避問題に適用し、有効性を確認した。
All 2009 2008 2007
All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (4 results)
八戸工業高等専門学校紀要 43号
Pages: 65-68
八戸工業高等専門学校紀要 42号