2007 Fiscal Year Annual Research Report

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

Research Project

Project/Area Number	18500175
Research Institution	Kyushu Institute of Technology
Principal Investigator	石川眞澄 Kyushu Institute of Technology, 大学院・生命体工学研究科, 教授 (60222973)
Co-Investigator(Kenkyū-buntansha)	章宏九州工業大学, 大学院・生命体工学研究科, 助教 (30235709)
Keywords	知能ロボティクス / 自己組織化 / 強化学習
Research Abstract	(1)ダイナミクス学習層と強化学習層が1対1に対応する場合とそうでない場合があり、課題依存であることが分かった。前者の例として、対象のダイナミクスに依存して強化学習モジュールが定まる課題が、後者の例として、対象の存在場所に依存して強化学習モジュールが定まる課題がある。ダイナミクス学習層と強化学習層が1対1に対応する場合の方が本提案の有用性が大きいので、ここでは前者のみを考える。 (2)課題として、2エージェントからなる追跡・逃避ゲームを取り上げた。各エージェントの速度や疲れ特性によって定まる追跡・逃避時の相対運動をダイナミクスと考え、ダイナミクス毎に強化学習モジュールを形成し、エージェントの特性が変化しても追跡・逃避を最適に行うという課題を考える。 (3)この課題をそのまま扱うと状態数が大きすぎて強化学習が困難となるので、相対位置や障害物の位置などに着目して、状態数を減らす。この課題に対して、適切な強化学習モジュール群に近傍学習を行わせるという強化学習の予備的実験を行い、これが計算可能であることを確認した。 (4)上記課題に対し、ダイナミクス学習層と強化学習層を統合した予備的実験を行った。強化学習という観点から見て、ダイナミクス学習層での分節化が適切になされているか否かは課題依存であり、ここで考えている課題では当然ながら適切に分節化できている。この統合はまだ予備的実験に留まっており、詳細な検討は平成20年度に引き続き実施する予定である。

Research Products
(7 results)

All 2007 Other

All Journal Article (4 results) (of which Peer Reviewed: 3 results) Presentation (1 results) Book (1 results) Remarks (1 results)

[Journal Article] Task Segmentation in a Mobile Robot by mnSOM: A New Approach To Training Expert Modules2007
- Author(s)
  M.Aziz Muslim
- Journal Title
  
  Neural Computing and Applications 16-6
  
  Pages: 571-580
- Peer Reviewed
[Journal Article] Brain-inspired emergence of behaviors in mobile robots2007
- Author(s)
  M.Ishikawa
- Journal Title
  
  Brain-Inspired IT 1301
  
  Pages: 48-51
- Peer Reviewed
[Journal Article] Prediction of the optimal parameter values in reinforcement learning as a funcation of the environment2007
- Author(s)
  K.Kamei
- Journal Title
  
  Brain-Inspired IT 1301
  
  Pages: 210-213
- Peer Reviewed
[Journal Article] Trends2007
- Author(s)
  Frederik Linaker
- Journal Title
  
  Neural Computation(Robot Localization Using Vision), Springer
  
  Pages: 483-512
[Presentation] Task Segmentation in a Mobile Robot by mnSOM and Clustering with Spatio-temporal Contiguity2007
- Author(s)
  M.Aziz Muslim
- Organizer
  ICONIP2007
- Place of Presentation
  北九州市
- Year and Date
  2007-11-16
[Book] Trends in Neural Computation(Robot Localization Using Vision)2007
- Author(s)
  Frederik Linaker
- Total Pages
  483-512
- Publisher
  Springer
[Remarks]
- URL
  http://www.brain.kyutech.ac.jp/~ishikawa

2007 Fiscal Year Annual Research Report

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

Principal Investigator

石川 眞澄 Kyushu Institute of Technology, 大学院・生命体工学研究科, 教授 (60222973)

Research Products

[Journal Article] Task Segmentation in a Mobile Robot by mnSOM: A New Approach To Training Expert Modules2007

Author(s)

Journal Title

[Journal Article] Brain-inspired emergence of behaviors in mobile robots2007

Author(s)

Journal Title

[Journal Article] Prediction of the optimal parameter values in reinforcement learning as a funcation of the environment2007

Author(s)

Journal Title

[Journal Article] Trends2007

Author(s)

Journal Title

[Presentation] Task Segmentation in a Mobile Robot by mnSOM and Clustering with Spatio-temporal Contiguity2007

Author(s)

Organizer

Place of Presentation

Year and Date

[Book] Trends in Neural Computation(Robot Localization Using Vision)2007

Author(s)

Total Pages

Publisher

[Remarks]

URL

石川眞澄 Kyushu Institute of Technology, 大学院・生命体工学研究科, 教授 (60222973)