• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

強化学習を用いたサッカーのシューティングロボットの目的行動の獲得

研究課題

研究課題/領域番号 06650301
研究種目

一般研究(C)

配分区分補助金
研究分野 知能機械学・機械システム
研究機関大阪大学

研究代表者

浅田 稔  大阪大学, 工学部, 助教授 (60151031)

研究分担者 細田 耕  大阪大学, 工学部, 助手 (10252610)
研究期間 (年度) 1994
研究課題ステータス 完了 (1994年度)
配分額 *注記
2,000千円 (直接経費: 2,000千円)
1994年度: 2,000千円 (直接経費: 2,000千円)
キーワード強化学習 / 行動獲得 / 視覚 / 簡単なタスクからの学習 / 状態-行動空間のずれ
研究概要

ロボティクスや人口知能研究の究極の目的は,変動する環境との相互作用を通して,自ら作業計画を立て,遂行する自律的なエージェントを実現させることである.これまでの典型的な知能ロボットでは,処理の階層化による段階的処理で構成されており,このような直列的な処理系では,外界の変動に対して非常に弱いシステムであることが指摘され,行動規範型のロボットが出現しつつある.これらの行動規範型のロボットは環境変動に対応し,反射的な行動を上手にこなすが,目的行動そのものを獲得し生成する能力に欠けている.本研究では,強化学習を用いて,ロボット自らが,環境との相互作用を通して,目的行動を獲得し生成する能力を実現することを目的として,実際のロボットシステム(サッカーのシューティングロボット)を構築し,強化学習による目的行動獲得能力の解析ならびに評価を行なった.
強化学習を実際のロボットシステムに適用する際の問題点として,「学習の高速化」及び「状態空間と行動空間のずれ」が挙げられる.前者に対しては,簡単なタスクからの学習LEM(Learning Easy Missions)を提案し,状態空間の大きさの指数オーダーから線形オーダーに学習時間が低減できることを示した.また,後者に対しては,行動空間を状態空間に合わせて再構成することにより解決した.以上をサッカーロボットが,ボールを発見し,ドリブルして,ゴールにシュートする複雑で動的なタスクに適用した.まず,コンピュータシミュレーションにより,学習の高速化を検証した.また,移動ロボットにカラーTVカメラを搭載した実機を使った実験で学習結果を検証した.ビデオノイズによる多少の画像処理の失敗に拘らず、シュートすることができ,本手法の有効性・ロバスト性を確認できた.

報告書

(1件)
  • 1994 実績報告書
  • 研究成果

    (5件)

すべて その他

すべて 文献書誌 (5件)

  • [文献書誌] M.Asada,S.Noda,S.Tawaratsumida,and K.Hosada: "Vision-Based Behavior Acquisition For A Shooting Rubot by Using A Reinforcemeut Learning" Proc.of IAPR/IEEE Workshop on Visual Behaviors. 112-118 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] M.Asada,S.Nada,S.Tawaratsumida,and K.Hosoda: "Purposive Behavicr Acquisition On A Real Robot By Vision-Based Reinforcemeut Learning" Proc.of MLC-COLT(Machine Learning Confernce and Computer Learning Theory)Workshop on Robot Learning. 1-9 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Vision-Based Reinforcemeut Learning For Cocrdination Of Soccer Playing Behaviors" Proc.of AAAI-94 Workshop on AI,Artificial Life,and Entertainment. 16-21 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] M.Asada,E.Uchibe,S.Noda,S.Tawaratsumida and K.Hosoda: "Coordination Of Multiple Behaviors Acquired By Vision-Based Reinforcemeut Leaning" Proc.of IEEE/RSJ/GI International Conference on Intelligent Robots and Systems. 917-924 (1994)

    • 関連する報告書
      1994 実績報告書
  • [文献書誌] 浅田,野田,俵積田,細田: "「視覚に基づく強化学習によるロボットの行動獲得」" 日本ロボット学会誌. vol.13,no.1. 68-74 (1995)

    • 関連する報告書
      1994 実績報告書

URL: 

公開日: 1994-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi