2000 Fiscal Year Annual Research Report
Project/Area Number |
12680369
|
Research Institution | The University of Tokyo |
Principal Investigator |
永野 三郎 東京大学, 大学院・総合文化研究科, 教授 (50010913)
|
Co-Investigator(Kenkyū-buntansha) |
植田 一博 東京大学, 大学院・総合文化研究科, 助教授 (60262101)
|
Keywords | サッカーエージェント / 適応学習 / 協調 / 戦術 / 強化学習 / ベイズ推定 |
Research Abstract |
サッカーサーバー上で動くサッカーエージェントについては,マルチエージェントシステムの標準問題として多くの研究がなされており,エージェントがボールを扱う上での基本スキルの研究や,エージェントをフィールドに配置するフォーメーションや攻撃パターンなど戦略の研究が主となっている.しかし,スキルと戦略とのあいだには本来戦術という階層が存在すると,実際のサッカーの専門家は指摘している.申請者は現在までに,戦術の中でも特に重要だと考えられる協調的戦術を学習によって獲得するサッカーエージェントの構築を目的とし,実際のサッカーの指導で戦術がいかに獲得されるかを参考に,小人数による練習課題の達成,グリッドによる適切な認知地図の獲得,そして,適応学習によるプレーの最適化を軸にした協調戦術決定学習アルゴリズムを提案し,そのパフォーマンスをシミュレーションにより検証してきた.エージェントは環境をグリッド化して知覚することで有限の状態変数空間を持ち,他エージェントの挙動を条件付き確率によって予測推定する.さらに推定結果と各状態変数の効用に基づき自らの戦術を決定する.練習を通じエージェントは状態間の条件付確率と効用関数を学習することができる.シミュレーションの結果,ミニフィールドにおいて,壁パスやワン・ツー・パスのような局所的協調戦術が適応学習によって獲得されることが確認された.エージェントは,ボールタッチ等により報酬を受ける従来のサッカーエージェントとは異なり,望ましい状況についての効用を参照しているので,より協調の面において,優れた学習結果を示していた.さらに,シミュレーションで経験した状態列の遷移を適切にチャンク化することで学習結果に一貫した戦術の傾向を観察することができた.
|
Research Products
(1 results)