2006 年度実績報告書

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

研究課題

研究課題/領域番号	18500175
研究種目	基盤研究(C)
研究機関	九州工業大学
研究代表者	石川眞澄九州工業大学, 大学院生命体工学研究科, 教授 (60222973)
研究分担者	章宏九州工業大学, 大学院生命体工学研究科, 助手 (30235709)
キーワード	知能ロボティクス / 自己組織化 / 強化学習
研究概要	(1)開発済みのダイナミクス学習層に加えて強化学習層を中心に手法の理論的検討を行った。移動ロボットを対象とする強化学習としてはQ学習が適していることを確認し、必要に応じてDyna-Q、適格度トレースなどの高速化手法を付け加えるのが良い。勝者モジュールの時間的空間的安定性についても検討したが、これを重視すると分節化の性能が低下することから、時間的空間的安定性については取り入れないこととする。 (2)強化学習部分のプログラム作成を行った。当初ダイナミクス学習層と強化学習層が1対1に対応するものと考えていたが、そうなる場合もあるし、そうでない場合もあることが分かってきた。従って既に作成済みのモジュラーネットワーク自己組織化マップ(mnSOM)プログラムとの接続の方法については今後の課題として残されている。 (3)移動ロボットKheperaIIあるいはその後継機であるe-puckをフィールド内で動かし、赤外線センサーおよび制御信号データを取得し、予備的実験のためのデータとした。同時に上部から移動ロボットをビデオカメラで撮影し、センサーデータに基づく移動ロボットの位置・方位の推定誤差を計算できるような環境を整えた。 (4)ダイナミクス学習層において、mnSOMを用いて移動ロボットのダイナミクスの学習および分節化を行ない、学習および分節化が可能であることを確認した。またこの過程で競合学習により分節化を行うのと比較して、計算が安定的に行えることを確認した。 (5)(1)に述べたようにダイナミクス学習層と強化学習の関係がまだ検討を要するので、強化学習層での近傍学習については今後の課題として残されている。

研究成果
(6件)

すべて 2007 2006

すべて雑誌論文 (5件) 図書 (1件)

[雑誌論文] パラメータの相互依存性を考慮した強化学習の最適パラメータ推定2007
- 著者名/発表者名
  亀井圭史, 石川眞澄
- 雑誌名
  
  電子情報通信学会技術研究報告 Vol.106, No.588, NC2006-150
  
  ページ: 191-196
[雑誌論文] A New Approach to Task Segmentation in Mobile Robots by mnSOM2006
- 著者名/発表者名
  Muhammad Aziz Muslim, Masumi Ishikawa, Tetsuo Furukawa
- 雑誌名
  
  IEEE World Congress on Computational Intelligence, Vancouver, Canada
  
  ページ: 6542-6549
[雑誌論文] Training expert modules for a mobile robot using mnSOM2006
- 著者名/発表者名
  Muhammad Aziz Muslim, Masumi Ishikawa, Tetsuo Furukawa
- 雑誌名
  
  Abstracts of BrainIT2006 (The Third International Conference on Brain-Inspired Information Technology)
  
  ページ: 73
[雑誌論文] Prediction of the optimal values of parameters in reinforcement learning as a function of the environment2006
- 著者名/発表者名
  Keiji Kamei, Masumi Ishikawa
- 雑誌名
  
  Abstracts of BrainIT2006 (The Third International Conference on Brain-Inspired Information Technology)
  
  ページ: 85
[雑誌論文] Dependency of values of parameters in reinforcement learning for navigation of a mobile robot on the environment2006
- 著者名/発表者名
  Keiji Kamei, Masumi Ishikawa
- 雑誌名
  
  Neural Information Processing---Letters and Reviews Vol.10, No.7-9
  
  ページ: 219-226
[図書] Brain-Inspired IT II (Reduction of computational cost in optimization of parameter values in reinforcement learning by a genetic algorithm)2006
- 著者名/発表者名
  Keiji Kamei, Masumi Ishikawa
- 総ページ数
  292
- 出版者
  Elsevier

2006 年度 実績報告書

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

研究代表者

石川 眞澄 九州工業大学, 大学院生命体工学研究科, 教授 (60222973)

研究成果

[雑誌論文] パラメータの相互依存性を考慮した強化学習の最適パラメータ推定2007

著者名/発表者名

雑誌名

[雑誌論文] A New Approach to Task Segmentation in Mobile Robots by mnSOM2006

著者名/発表者名

雑誌名

[雑誌論文] Training expert modules for a mobile robot using mnSOM2006

著者名/発表者名

雑誌名

[雑誌論文] Prediction of the optimal values of parameters in reinforcement learning as a function of the environment2006

著者名/発表者名

雑誌名

[雑誌論文] Dependency of values of parameters in reinforcement learning for navigation of a mobile robot on the environment2006

著者名/発表者名

雑誌名

[図書] Brain-Inspired IT II (Reduction of computational cost in optimization of parameter values in reinforcement learning by a genetic algorithm)2006

著者名/発表者名

総ページ数

出版者

2006 年度実績報告書

石川眞澄九州工業大学, 大学院生命体工学研究科, 教授 (60222973)