1995 Fiscal Year Annual Research Report

視覚に基づく強化学習による競技ロボットの多重タスク遂行のための協調行動の獲得

Research Project

Project/Area Number	07455112
Research Category	Grant-in-Aid for General Scientific Research (B)
Research Institution	Osaka University
Principal Investigator	浅田稔大阪大学, 工学部, 教授 (60151031)
Co-Investigator(Kenkyū-buntansha)	鈴木昭二大阪大学, 工学部, 助手 (50273587) 細田耕大阪大学, 工学部, 助手 (10252610)
Keywords	強化学習 / Q学習 / 多重タスク / 競合行動 / 協調行動
Research Abstract	強化学習を多重タスクに応用する例としてサッカーを対象とし,本年は1:1のシュート行動について,各種シミュレーション及び実ロボットによる実験を行った.本年度の研究実績及び評価は以下の通りである. 1.強化学習の一つであるQ学習を用いて,個々のサブタスクに対応する行動を獲得した.すなわち,シューティング行動と,ゴールキーパ-回避行動である.これらの手法に関しては既に学習法が確立しており,何の問題もなかった. 2.獲得された行動を組み合わせて協調行動を獲得するシミュレーションを実施した.統合方法として,二つの行動価値関数の単純和による新たな行動価値関数による協調,ある条件による行動価値関数の切り分け(但し,条件設定は固定),矛盾する状態に対処すらための再学習法を比較検討した.その結果,行動価値関数の総和や単純な条件設定での行動切替えでは,矛盾する状態に対応できず,再学習による手法が,シュート率,シュートに要する平均ステップ数,ゴールキーパ-回避率で共に優れていた.但し,再学習は状態空間のサイズが増大し,多大な学習時間を必要としたので,学習法自体に工夫を施したが,更なる改善が必要と思われる. 3.ゴールキーパ-は,最初,怠惰な行動をとるように設定し,協調行動が収束した時点で,徐々にゴールを阻止する行動をとるようにし,シューティング行動のスキル向上を図った. 4.実ロボットを用いた基礎的な実験を行った.実時間によるカラー画像処理装置を用いて相手やボール,ゴールを検出し,シミュレーションで獲得した行動を実現した.問題点として,照明やノイズ,スリップなどの影響があり,これらにどう対処すべきかの課題が残った.

Research Products
(4 results)

All Other

All Publications (4 results)

[Publications] Minoru Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)
[Publications] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティクス・メカトロニクス講演会95予稿集. 700-703 (1995)
[Publications] 内部英治: "他のエージェントの行動理解-サッカーロボットにおける強化学習のマルチエージェント環境への適用に向けて-" 第13回日本ロボット学会学術講演会予稿集. 241-242 (1995)
[Publications] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散シンポジウム予稿集. 371-374 (1996)

1995 Fiscal Year Annual Research Report

視覚に基づく強化学習による競技ロボットの多重タスク遂行のための協調行動の獲得

Principal Investigator

浅田 稔 大阪大学, 工学部, 教授 (60151031)

Research Products

[Publications] Minoru Asada: "Agents that learn from other competitive agents" Proc.of Machine Learning Conference Workshop on Agents That Learn from Other Agents. 1-7 (1995)

[Publications] 内部英治: "視覚を有する移動ロボットの強化学習による複数タスクの達成" ロボティクス・メカトロニクス講演会95予稿集. 700-703 (1995)

[Publications] 内部英治: "他のエージェントの行動理解-サッカーロボットにおける強化学習のマルチエージェント環境への適用に向けて-" 第13回日本ロボット学会学術講演会予稿集. 241-242 (1995)

[Publications] 内部英治: "競合エージェントの存在する環境での視覚に基づく強化学習によるロボットの行動獲得" 第8回自律分散シンポジウム予稿集. 371-374 (1996)

浅田稔大阪大学, 工学部, 教授 (60151031)