研究課題/領域番号 |
19500172
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知覚情報処理・知能ロボティクス
|
研究機関 | 八戸工業高等専門学校 |
研究代表者 |
釜谷 博行 八戸工業高等専門学校, 電気情報工学科, 教授 (70224657)
|
研究分担者 |
工藤 憲昌 独立行政法人国立高等専門学校機構八戸工業高等専門学校, 電気情報工学科, 教授 (40270194)
|
連携研究者 |
工藤 憲昌 八戸工業高等専門学校, 電気情報工学科, 教授 (40270194)
|
研究期間 (年度) |
2007 – 2008
|
研究課題ステータス |
完了 (2008年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2008年度: 1,950千円 (直接経費: 1,500千円、間接経費: 450千円)
2007年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
|
キーワード | 強化学習 / 関数近似 / 自律移動ロボット / 機械学習 / エージェント / 統計数学 / ハイパフォーマンス・コンピューティング / 知能ロボティクス |
研究概要 |
高次元の連続状態空間を直接扱うことのできるモデル追加型の強化学習アルゴリズムを開発した。このアルゴリズムの最大の特徴は、関数近似器のパラメータをうまく設定することで、モデル数を小さく抑えつつも良好な学習性能を実現できる点にある。このため、まず、パラメータの挙動解析を行い、最良のパラメータを見出した。つぎに、10次元の連続状態空間をもつ移動ロボットの移動障害物回避問題に適用し、有効性を確認した。
|