• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2008 年度 実績報告書

環境の時間的空間的分節化に基づく強化学習の高度化と移動ロボットへの応用

研究課題

研究課題/領域番号 18500175
研究機関九州工業大学

研究代表者

石川 眞澄  九州工業大学, 生命体工学研究科, 教授 (60222973)

研究分担者 章 宏  九州工業大学, 生命体工学研究科, 助教 (30235709)
キーワード知能ロボティクス / 自己組織化 / 強化学習
研究概要

1.追跡・逃避ゲームをテストベッドとし、モジュール型ネットワーク自己組織化マップ(mnSOM)を用いたダイナミクス学習層により追跡逃避者間の距離の時間変化を学習し、追跡者・逃避者の最適制御を相互距離の時間変化の違いに基づいてモジュール化した強化学習層により学習するという、統合的実験を行った。
2.近傍学習を用いたダイナミクス学習層による相互距離の時間変化の学習により、モジュールの位相保存的マップの形成、および適切な内挿モジュールの生成を確認した。なお、近傍学習により強化学習が加速化すると考えていたが、個別に学習する場合と比較して有意な差は見られなかった。
3.与えられた相互距離の時間変化に最も近いモジュールが発火し、これに対応する強化学習モジュールの制御則を用いることにより、捕獲回数に関する性能が高いことを確認した。
4.環境が変化した場合に、この変化を検出し、変化した環境に適応することが重要である。占有グリッドを用いて地図形成を行う際、各グリッドでの占有確率がほぼ二項分布に従うことを用いて変化を検出し、地図を修正することが可能となる。ただシミュレーション実験による実証が完全には終わっていないので、早急に完了させ、論文および研究成果報告書として取り纏める予定である。
5.ダイナミクスを学習するMOSAICと強化学習モジュールを組み合わせた銅谷らの研究と比較して、計算が安定的であること、モジュール数を事前に厳密に決める必要が無いこと、内挿モジュールが生成されることなど種々の利点があり、研究の意義は大きいと考えている。

  • 研究成果

    (14件)

すべて 2009 2008 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (11件) 図書 (1件) 備考 (1件)

  • [雑誌論文] A Fast Stereo Matching Algorithm for Sewer Inspection Robots2008

    • 著者名/発表者名
      Alireza Ahrary, Masumi Ishikawa
    • 雑誌名

      IEEJ Transactions on Electrical and Electronic Engineering 3

      ページ: 441-448

    • 査読あり
  • [学会発表] 強化学習を用いた生存欲に基づく行動の創発2009

    • 著者名/発表者名
      守田観輝夫, 石川波澄
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      東京都町田市
    • 年月日
      2009-03-13
  • [学会発表] グリッドペース地図誤差に基づく好奇心を内部報酬とする強化学習2009

    • 著者名/発表者名
      田中芳典, 石川眞澄
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      東京都町田市
    • 年月日
      2009-03-13
  • [学会発表] 拡散的好奇心付き標準的粒子群最適化器の効果2009

    • 著者名/発表者名
      章宏, 石川眞澄
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      東京都町田市
    • 年月日
      2009-03-12
  • [学会発表] 知能の根源としての分節化と好奇心2008

    • 著者名/発表者名
      石川眞澄
    • 学会等名
      日本知能情報ファジィ学会合同ワークショップ
    • 発表場所
      福岡市
    • 年月日
      2008-12-06
  • [学会発表] Segmentation and curiosity as origins of intelligence(Keynote Speech)2008

    • 著者名/発表者名
      Masumi Is
    • 学会等名
      Int. Workshop on Hybrid and Adaptive Systems for Real-time Robotics Vision
    • 発表場所
      オークランド
    • 年月日
      2008-11-28
  • [学会発表] Brain-inspired emergence of behaviors based on the desire for existence by reinforcement learning2008

    • 著者名/発表者名
      Masumi Ishikawa, Mikio Morita
    • 学会等名
      International Conference on Neural Information Processing (ICONIP2008)
    • 発表場所
      オークランド
    • 年月日
      2008-11-26
  • [学会発表] Brain-inspired emergence of behaviors in mobile robots by reinforcement learning with internal rewards2008

    • 著者名/発表者名
      M. Ishikawa, T. Hagiwara, N. Yamamoto, F. Kiriake
    • 学会等名
      8th Internationa Conference on Hybrid Intelligent Systems(HIS2008)
    • 発表場所
      バルセロナ
    • 年月日
      2008-09-10
  • [学会発表] Evolutionary Canonical Particle Swarm Optimizer --? A Proposal of Meta-Optimization in Model Selection2008

    • 著者名/発表者名
      Hong Zhang, Masumi Ishikawa
    • 学会等名
      18th International Conference on Arfiticial Neural Networks (ICANN2008)
    • 発表場所
      プラハ
    • 年月日
      2008-09-05
  • [学会発表] Brain-inspired Emergence of Behaviors by Reinforcement Learning2008

    • 著者名/発表者名
      Masumi Ishikawa, Mikio Morita, Takao Hagiwara
    • 学会等名
      8th Postech-Kyutech Joint Workshop on Neuroinformatics
    • 発表場所
      北九州
    • 年月日
      2008-08-26
  • [学会発表] フェロー記念講演「忘却から好奇心へ」2008

    • 著者名/発表者名
      石川眞澄
    • 学会等名
      電子情報通信学会ニューロコンピューティング研究会
    • 発表場所
      沖縄
    • 年月日
      2008-06-26
  • [学会発表] Formation of Graph-based Maps for Mobile Robots using Hidden Markov Models2008

    • 著者名/発表者名
      M. Aziz Muslim, Masumi Ishikawa
    • 学会等名
      2008 IEEE World Congress on Computational Intelligence (WCCI2008)
    • 発表場所
      香港
    • 年月日
      2008-06-03
  • [図書] Trends in Intelligent Systems and Computer Engineering2008

    • 著者名/発表者名
      Hong Zhang, Masumi Ishikawa
    • 総ページ数
      16
    • 出版者
      Springer
  • [備考]

    • URL

      http://www.brain.kyutech.ac.jp/~ishikawa

URL: 

公開日: 2010-06-11   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi