• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

共進化的環境創造による自律移動ロボットのメタレベル行動学習

研究課題

研究課題/領域番号 14750362
研究種目

若手研究(B)

配分区分補助金
研究分野 制御工学
研究機関東京工業大学

研究代表者

近藤 敏之  東京工業大学, 大学院・総合理工学研究科, 助手 (60323820)

研究期間 (年度) 2002 – 2003
研究課題ステータス 完了 (2003年度)
配分額 *注記
3,300千円 (直接経費: 3,300千円)
2003年度: 1,400千円 (直接経費: 1,400千円)
2002年度: 1,900千円 (直接経費: 1,900千円)
キーワード強化学習 / 進化的計算 / NGnet / 関数近似器 / 自律移動ロボット / 追加学習 / 学習スキーマの抽出 / 正規化ガウシアンネットワーク / 動的関数近似 / オンライン学習
研究概要

本研究では,高次元・連続な状態入出力を有する制御対象として自律移動ロボットをとりあげ,その感覚・行動間写像の同定に強化学習法を適用する際に問題となる,計算資源の割当て問題を解決するための一手法として,NGnetで実装したActor-Critic強化学習に学習器の構造パラメータを同時に探索する進化的recruitment戦略を導入する手法を提案した.
昨年度までに検証した提案アルゴリズムの有効性と実ロボットによる実証実験は,計測自動制御学会論文集ならびにJournal of Robotics and Autonomous Systemsに掲載された.
また,本年度は学習器の構造最適化に加えて,「いかにして複雑な学習課題を効率よく学習するか?」という,学習のスケジューリングに関する研究にも同時並行して取り組んだ.発達心理学におけるpiagetの先駆的研究を参考に,人間の身体と神経系の共進化的発達と,近年,盛んに研究が行われ始めている認知発達ロボティクスの関連に着目した.すなわち,多自由度な感覚運動連関を有する移動ロボットの制御器を強化学習で学習する際に,過去の学習事例から「学習のコツ」となる拘束条件を抽出して記憶しておき,これを未学習課題の習得に拘束条件として用いることで,無駄な試行錯誤数を削減し,その結果として強化学習を高速化することができる,「拘束条件抽出型強化学習法」を提案した.

報告書

(2件)
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (10件)

すべて その他

すべて 文献書誌 (10件)

  • [文献書誌] Toshiyuki Kondo, Koji Ito: "A Reinforcemnt Learning with Evolutionary State Recruitment Strategy for Autonomous Mobile Robots Control"Journal of Robotics and Autonomous Systems. 46・2. 111-124 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 近藤敏之, 伊藤紀彦, 伊藤宏司: "拘束ルール抽出機構を用いた自律移動ロボットの段階的行動学習"計測自動制御学会論文集. 40・3(掲載決定). (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] 近藤敏之, 伊藤宏司: "進化的recruitment戦略を用いた強化学習による自律移動ロボットの制御器設計"計測自動制御学会論文集. 39・9. 857-864 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshiyuki Kondo, Koji Ito: "A Study on Designing Robot Controllers by Using Reinforcement Learning with Evolutionary State Recruitment Strategy"Proceedings of the First International Workshop on Biologically Inspired Approaches to Advanced Information Technology. 1. 1-15 (2004)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshiyuki Kondo, Koji Ito: "A Study on Designing Controller for Peg-pushing Robot by Using Reinforcement Learning with Adaptive State Recruitment Strategy"Proceedings of SICE Annual Conference 2003. (CD-ROM). MPI-17-2 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshiyuki Kondo, Norihiko Itoh, Koji Ito: "An Incremental Learning using Schema Extraction Mechanism for Autonomous Mobile Robot"Proceedings of 2003 IEEE International Symposium on Computational Intelligence in Robotics and Automation. (CD-ROM). 1126-1131 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Toshiyuki Kondo, Koji Ito: "A Reinforcement Learning with Adaptive State Space Recruitment Strategy for Real Autonomous Mobile Robots"Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS'02). (CD-ROM). ID:393 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 近藤敏之, 伊藤宏司: "環境共創による適応的行動学習 -実移動ロボットによる押し動作獲得"計測自動制御学会システム・情報部門学術講演会2002講演論文集(優秀論文賞受賞). 423-428 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] 近藤敏之, 伊藤宏司: "共進化環境創造による実移動ロボットのPeg押し動作学習"日本ロボット学会創立20周年記念学術講演会. (CD-ROM). 3H32 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] Toshiyuki Kondo, Koji Ito: "A Reinforcement Learning using Adaptive State Space Construction Strategy for Real Autonomous Mobile Robots"Proceedings of SICE Annual Conference 2002. (CD-ROM). WM13-2 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi