• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2007 年度 実績報告書

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

研究課題

研究課題/領域番号 18500175
研究機関九州工業大学

研究代表者

石川 眞澄  九州工業大学, 大学院・生命体工学研究科, 教授 (60222973)

研究分担者 章 宏  九州工業大学, 大学院・生命体工学研究科, 助教 (30235709)
キーワード知能ロボティクス / 自己組織化 / 強化学習
研究概要

(1)ダイナミクス学習層と強化学習層が1対1に対応する場合とそうでない場合があり、課題依存であることが分かった。前者の例として、対象のダイナミクスに依存して強化学習モジュールが定まる課題が、後者の例として、対象の存在場所に依存して強化学習モジュールが定まる課題がある。ダイナミクス学習層と強化学習層が1対1に対応する場合の方が本提案の有用性が大きいので、ここでは前者のみを考える。
(2)課題として、2エージェントからなる追跡・逃避ゲームを取り上げた。各エージェントの速度や疲れ特性によって定まる追跡・逃避時の相対運動をダイナミクスと考え、ダイナミクス毎に強化学習モジュールを形成し、エージェントの特性が変化しても追跡・逃避を最適に行うという課題を考える。
(3)この課題をそのまま扱うと状態数が大きすぎて強化学習が困難となるので、相対位置や障害物の位置などに着目して、状態数を減らす。この課題に対して、適切な強化学習モジュール群に近傍学習を行わせるという強化学習の予備的実験を行い、これが計算可能であることを確認した。
(4)上記課題に対し、ダイナミクス学習層と強化学習層を統合した予備的実験を行った。強化学習という観点から見て、ダイナミクス学習層での分節化が適切になされているか否かは課題依存であり、ここで考えている課題では当然ながら適切に分節化できている。この統合はまだ予備的実験に留まっており、詳細な検討は平成20年度に引き続き実施する予定である。

  • 研究成果

    (7件)

すべて 2007 その他

すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (1件) 図書 (1件) 備考 (1件)

  • [雑誌論文] Task Segmentation in a Mobile Robot by mnSOM: A New Approach To Training Expert Modules2007

    • 著者名/発表者名
      M.Aziz Muslim
    • 雑誌名

      Neural Computing and Applications 16-6

      ページ: 571-580

    • 査読あり
  • [雑誌論文] Brain-inspired emergence of behaviors in mobile robots2007

    • 著者名/発表者名
      M.Ishikawa
    • 雑誌名

      Brain-Inspired IT 1301

      ページ: 48-51

    • 査読あり
  • [雑誌論文] Prediction of the optimal parameter values in reinforcement learning as a funcation of the environment2007

    • 著者名/発表者名
      K.Kamei
    • 雑誌名

      Brain-Inspired IT 1301

      ページ: 210-213

    • 査読あり
  • [雑誌論文] Trends2007

    • 著者名/発表者名
      Frederik Linaker
    • 雑誌名

      Neural Computation(Robot Localization Using Vision), Springer

      ページ: 483-512

  • [学会発表] Task Segmentation in a Mobile Robot by mnSOM and Clustering with Spatio-temporal Contiguity2007

    • 著者名/発表者名
      M.Aziz Muslim
    • 学会等名
      ICONIP2007
    • 発表場所
      北九州市
    • 年月日
      2007-11-16
  • [図書] Trends in Neural Computation(Robot Localization Using Vision)2007

    • 著者名/発表者名
      Frederik Linaker
    • 総ページ数
      483-512
    • 出版者
      Springer
  • [備考]

    • URL

      http://www.brain.kyutech.ac.jp/~ishikawa

URL: 

公開日: 2010-02-04   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi