強化学習を用いたサッカーのシューティングロボットの目的行動の獲得

研究課題

研究課題/領域番号	06650301
研究種目	一般研究(C)
配分区分	補助金
研究分野	知能機械学・機械システム
研究機関	大阪大学
研究代表者	浅田稔大阪大学, 工学部, 助教授 (60151031)
研究分担者	細田耕大阪大学, 工学部, 助手 (10252610)
研究期間 (年度)	1994
研究課題ステータス	完了 (1994年度)
配分額 *注記	2,000千円 (直接経費: 2,000千円) 1994年度: 2,000千円 (直接経費: 2,000千円)
キーワード	強化学習 / 行動獲得 / 視覚 / 簡単なタスクからの学習 / 状態-行動空間のずれ
研究概要	ロボティクスや人口知能研究の究極の目的は,変動する環境との相互作用を通して,自ら作業計画を立て,遂行する自律的なエージェントを実現させることである.これまでの典型的な知能ロボットでは,処理の階層化による段階的処理で構成されており,このような直列的な処理系では,外界の変動に対して非常に弱いシステムであることが指摘され,行動規範型のロボットが出現しつつある.これらの行動規範型のロボットは環境変動に対応し,反射的な行動を上手にこなすが,目的行動そのものを獲得し生成する能力に欠けている.本研究では,強化学習を用いて,ロボット自らが,環境との相互作用を通して,目的行動を獲得し生成する能力を実現することを目的として,実際のロボットシステム(サッカーのシューティングロボット)を構築し,強化学習による目的行動獲得能力の解析ならびに評価を行なった. 強化学習を実際のロボットシステムに適用する際の問題点として,「学習の高速化」及び「状態空間と行動空間のずれ」が挙げられる.前者に対しては,簡単なタスクからの学習LEM(Learning Easy Missions)を提案し,状態空間の大きさの指数オーダーから線形オーダーに学習時間が低減できることを示した.また,後者に対しては,行動空間を状態空間に合わせて再構成することにより解決した.以上をサッカーロボットが,ボールを発見し,ドリブルして,ゴールにシュートする複雑で動的なタスクに適用した.まず,コンピュータシミュレーションにより,学習の高速化を検証した.また,移動ロボットにカラーTVカメラを搭載した実機を使った実験で学習結果を検証した.ビデオノイズによる多少の画像処理の失敗に拘らず、シュートすることができ,本手法の有効性・ロバスト性を確認できた.

報告書

(1件)

1994 実績報告書

研究成果
(5件)

すべてその他

すべて文献書誌 (5件)

[文献書誌] M.Asada,S.Noda,S.Tawaratsumida,and K.Hosada: "Vision-Based Behavior Acquisition For A Shooting Rubot by Using A Reinforcemeut Learning" Proc.of IAPR/IEEE Workshop on Visual Behaviors. 112-118 (1994)
- 関連する報告書
  1994 実績報告書
[文献書誌] M.Asada,S.Nada,S.Tawaratsumida,and K.Hosoda: "Purposive Behavicr Acquisition On A Real Robot By Vision-Based Reinforcemeut Learning" Proc.of MLC-COLT(Machine Learning Confernce and Computer Learning Theory)Workshop on Robot Learning. 1-9 (1994)
- 関連する報告書
  1994 実績報告書
[文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Vision-Based Reinforcemeut Learning For Cocrdination Of Soccer Playing Behaviors" Proc.of AAAI-94 Workshop on AI,Artificial Life,and Entertainment. 16-21 (1994)
- 関連する報告書
  1994 実績報告書
[文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Coordination Of Multiple Behaviors Acquired By Vision-Based Reinforcemeut Leaning" Proc.of IEEE/RSJ/GI International Conference on Intelligent Robots and Systems. 917-924 (1994)
- 関連する報告書
  1994 実績報告書
[文献書誌] 浅田,野田,俵積田,細田: "「視覚に基づく強化学習によるロボットの行動獲得」" 日本ロボット学会誌. vol.13,no.1. 68-74 (1995)
- 関連する報告書
  1994 実績報告書

強化学習を用いたサッカーのシューティングロボットの目的行動の獲得

研究代表者

浅田 稔 大阪大学, 工学部, 助教授 (60151031)

2,000千円 (直接経費: 2,000千円)

報告書

研究成果

[文献書誌] M.Asada,S.Noda,S.Tawaratsumida,and K.Hosada: "Vision-Based Behavior Acquisition For A Shooting Rubot by Using A Reinforcemeut Learning" Proc.of IAPR/IEEE Workshop on Visual Behaviors. 112-118 (1994)

関連する報告書

[文献書誌] M.Asada,S.Nada,S.Tawaratsumida,and K.Hosoda: "Purposive Behavicr Acquisition On A Real Robot By Vision-Based Reinforcemeut Learning" Proc.of MLC-COLT(Machine Learning Confernce and Computer Learning Theory)Workshop on Robot Learning. 1-9 (1994)

関連する報告書

[文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Vision-Based Reinforcemeut Learning For Cocrdination Of Soccer Playing Behaviors" Proc.of AAAI-94 Workshop on AI,Artificial Life,and Entertainment. 16-21 (1994)

関連する報告書

[文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Coordination Of Multiple Behaviors Acquired By Vision-Based Reinforcemeut Leaning" Proc.of IEEE/RSJ/GI International Conference on Intelligent Robots and Systems. 917-924 (1994)

関連する報告書

[文献書誌] 浅田,野田,俵積田,細田: "「視覚に基づく強化学習によるロボットの行動獲得」" 日本ロボット学会誌. vol.13,no.1. 68-74 (1995)

関連する報告書

浅田稔大阪大学, 工学部, 助教授 (60151031)