視覚に基づく強化学習による競技ロボットの多重タスク遂行のための協調行動

研究課題

研究課題/領域番号	07455112
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知能機械学・機械システム
研究機関	大阪大学
研究代表者	浅田稔大阪大学, 工学部, 教授 (60151031)
研究分担者	鈴木昭二大阪大学, 工学部, 助手 (50273587) 細田耕大阪大学, 工学部, 助教授 (10252610)
研究期間 (年度)	1995 – 1996
研究課題ステータス	完了 (1996年度)
配分額 *注記	7,500千円 (直接経費: 7,500千円) 1996年度: 2,000千円 (直接経費: 2,000千円) 1995年度: 5,500千円 (直接経費: 5,500千円)
キーワード	強化学習 / マルチロボット / 状態空間構成 / システム同定 / 赤池情報量基準 / 視覚移動ロボット / Q学習 / 多重タスク / 競合行動 / 協調行動
研究概要	強化学習を多重タスクに応用する例としてサッカーを対象とし,初年度は,1 : 1のシュート行動について,次年度は,(1)初年度実施した多重行動の統合(切替え)再学習時間の短縮,(2)マルチエージェント環境での行動学習のための他エージェントの行動モデル同定について,各種シミュレーション及び実ロボットによる実験を行った.研究実績及び評価は以下の通りである. 1.初年度: (1)強化学習の一つであるQ学習を用いて,個々のサブタスクに対応する行動を獲得した. (2)獲得された行動を組み合わせて協調行動を獲得するシミュレーションを実施した.統合方法として,種々の手法を試みたが,再学習による手法が,シュート率,シュートに要する平均ステップ数,ゴールキーパ-回避率で共に優れていた. (3)実ロボットを用いた基礎的な実験を行った.実時間によるカラー画像処理装置を用いて相手やボール,ゴールを検出し,シミュレーションで獲得した行動を実現した. 2.次年度 (1)各行動の学習結果得られた行動価値関数を基に,いずれかの行動が支配的で再学習を必要としない状態と,複数の行動が競合し,行動切替えに再学習を必要とする状態の二つのカテゴリに状態空間を分類し,再学習を必要とする領域のみを学習対象とすることで,学習時間の低減を図った. (2)統合によって生じる干渉状態は,学習データを情報量基準を用いて検出し,学習に適した状態空間を構成した.その結果として,前年度に比べ,学習時間を約1/3に短縮できた. (3)マルチエージェント環境での行動学習では,エージェントのモデル次数が既知でないと適切な学習が行えない.そこで,視覚情報から得られる画像特徴と学習者のモータコマンドとの関係をシステム同定の手法を用いて,各エージェントの次数を同定し,それらを基に状態空間を構成し,強化学習により協調行動を獲得した. (4)実機でパスされたボールをシュートする行動を獲得できた.

報告書

(3件)

1996 実績報告書研究成果報告書概要
1995 実績報告書

研究成果
(16件)

すべてその他

すべて文献書誌 (16件)

[文献書誌] M. Asada: "Agenst that learn from other competitive agents" Proc. of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティスク・メカトロニクス講演会95予稿集. 700-703 (1995)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 内部英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc. of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS'96). 1329-1336 (1996)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] M.Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] E.Uchibe: "Achievement of Multiple Tasks for a Mobile Robot with a Visual Sensor Using Delayd Reinforcement Learning" JSME Annual Conference on Robotics and Mechatronics (ROBOMECH '95). 1-7 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] E.Uchibe: "A Purposive Behavior Acquisition for a Soccer Robot Using Reinforcement Learning" TSUKUBA Software Symposium '96. 700-708 (1995)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc.of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS '96). 1329-1336 (1996)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  1996 研究成果報告書概要
[文献書誌] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散システム・シンポジウム資料. 371-374 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] 内部英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc.of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS'96). 1329-1336 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] Eiji Uchibe: "Vision-based reinforcement learning for robocup : Towards real robot competition" Proceeding of IROS-96 Workshop on RoboCup. 1329-1336 (1996)
- 関連する報告書
  1996 実績報告書
[文献書誌] Minoru Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティクス・メカトロニクス講演会95予稿集. 700-703 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 内部英治: "他のエージェントの行動理解-サッカーロボットにおける強化学習のマルチエージェント環境への適用に向けて-" 第13回日本ロボット学会学術講演会予稿集. 241-242 (1995)
- 関連する報告書
  1995 実績報告書
[文献書誌] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散シンポジウム予稿集. 371-374 (1996)
- 関連する報告書
  1995 実績報告書

視覚に基づく強化学習による競技ロボットの多重タスク遂行のための協調行動

研究代表者

浅田 稔 大阪大学, 工学部, 教授 (60151031)

7,500千円 (直接経費: 7,500千円)

報告書

研究成果

[文献書誌] M. Asada: "Agenst that learn from other competitive agents" Proc. of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)

説明

関連する報告書

[文献書誌] 内部 英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティスク・メカトロニクス講演会95予稿集. 700-703 (1995)

説明

関連する報告書

[文献書誌] 内部 英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)

説明

関連する報告書

[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc. of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS'96). 1329-1336 (1996)

説明

関連する報告書

[文献書誌] M.Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)

説明

関連する報告書

[文献書誌] E.Uchibe: "Achievement of Multiple Tasks for a Mobile Robot with a Visual Sensor Using Delayd Reinforcement Learning" JSME Annual Conference on Robotics and Mechatronics (ROBOMECH '95). 1-7 (1995)

説明

関連する報告書

[文献書誌] E.Uchibe: "A Purposive Behavior Acquisition for a Soccer Robot Using Reinforcement Learning" TSUKUBA Software Symposium '96. 700-708 (1995)

説明

関連する報告書

[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc.of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS '96). 1329-1336 (1996)

説明

関連する報告書

[文献書誌] 内部 英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散システム・シンポジウム資料. 371-374 (1996)

関連する報告書

[文献書誌] 内部 英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)

関連する報告書

[文献書誌] Eiji Uchibe: "Behavior coordination for a mobile robot using modular reinforcement learning" Proc.of IEEE/RSJ International Conference on Intelligent Robots and Systems 1996 (IROS'96). 1329-1336 (1996)

関連する報告書

[文献書誌] Eiji Uchibe: "Vision-based reinforcement learning for robocup : Towards real robot competition" Proceeding of IROS-96 Workshop on RoboCup. 1329-1336 (1996)

関連する報告書

[文献書誌] Minoru Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)

関連する報告書

[文献書誌] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティクス・メカトロニクス講演会95予稿集. 700-703 (1995)

関連する報告書

[文献書誌] 内部英治: "他のエージェントの行動理解-サッカーロボットにおける強化学習のマルチエージェント環境への適用に向けて-" 第13回日本ロボット学会学術講演会予稿集. 241-242 (1995)

関連する報告書

[文献書誌] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散シンポジウム予稿集. 371-374 (1996)

関連する報告書

浅田稔大阪大学, 工学部, 教授 (60151031)

[文献書誌] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティスク・メカトロニクス講演会95予稿集. 700-703 (1995)

[文献書誌] 内部英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)

[文献書誌] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散システム・シンポジウム資料. 371-374 (1996)

[文献書誌] 内部英治: "サッカーロボットの技能学習" つくばソフトウェアシンポジウム予稿集. 43-46 (1996)