2013 Fiscal Year Research-status Report
連続状態空間環境におけるロボット行動の評価方法と木構造を用いた連鎖行動探索
Project/Area Number |
24500241
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
中島 智晴 大阪府立大学, 工学(系)研究科(研究院), 教授 (20326276)
|
Co-Investigator(Kenkyū-buntansha) |
関 宏理 関西学院大学, 理工学部, 講師 (10583693)
秋山 英久 福岡大学, 工学部, 助教 (20533201)
|
Keywords | RoboCup / ファジィシステム / 行動連鎖 / エージェント |
Research Abstract |
最適な行動連鎖を探索するためのアルゴリズム開発を行った.特に,行動連鎖生成における評価関数の精度を向上させるためのシステム開発研究を行った.SIRMs ファジィシステムを用いて行動を評価するための枠組みとそのアルゴリズムについて議論を行い,アルゴリズムの性能についてシミュレーションにおける実験を行った.SIRMs の学習を行うための学習用データとして,戦略の優れているチームからのプレーヤ行動に焦点を当てることにした.具体的には,戦略の優れているチームのゲームログを詳細に解析し,プレーヤの行動とそれに伴うボールの移動から,パスやドリブルなどを類推する手法を導き出し,その手法を用いてボールの移動軌跡とチーム戦略における行動連鎖との関係を明らかにすることができた.行動連鎖の中で,得点につながったものを成功エピソードと定義し,成功エピソードの行動をSIRMs が学習できるような形式で情報変換した.SIRMs の非線形性と学習の柔軟さのおかげで,複雑なチーム戦略を実現することができる SIRms 評価関数を用いることが可能となった.計算機を用いたシミュレーション実験により,開発された評価手法の有効性が示された. さらに,チーム戦略の基礎となるパスやシュートなどの基本行動自体の精度を上げることにも注力し,パスコース選択あるごりずむやドリブルのキック位置計算など,限られた計算リソース内でも十分な制度が出るようなアルゴリズムの最適化を行った.この精度向上により,オランダで開催された RoboCup の世界大会では準優勝を収めることができた.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
行動探索木において,行動の評価はエージェント行動やチーム戦略の質を決める重要な要素である.評価が正しく行われなければ他の構成要素の向上をしても意味をなさないぐらい,核に相当する部分について一定の研究成果が得られていることは研究がおおむね順調であることを示している.
|
Strategy for Future Research Activity |
行動評価の質をさらに向上させるために,SIRMs ファジィシステムの構成パラメータやゲームログからの情報抽出などに変更を与えて開発されたアルゴリズムの完成度を高める.また,探索方法についても再考し,裁量優先探索アルゴリズム以外の探索法について有効性を調べる.さらに,これまで単一エージェントのみが保持していた行動連鎖を共有させるとチーム戦略にどのような影響があるか調査する.
|
Expenditure Plans for the Next FY Research Funding |
現在研究開発しているアルゴリズムに必要なデータが大規模とならず,1年度目で購入した計算機で実行可能である. 大規模計算機を設置する場所の調整にも時間がかかっており,電源や空調などの整備ができずに購入し稼働してしまうと,計算機へ大幅な負荷がかかり故障が多発する.その結果研究がすすめられなくなる恐れがある. 今年度の前半のうちに現状のアルゴリズムを発展させ,また,必要な計算量とデータを保存するのに必要な記憶容量について見積もりを立てる.上記と共に,設置する部屋の調整を今年度までに終わらせる. 7月に RoboCup 世界大会に出場し,アルゴリズムの有効性を検証するためにブラジル出張をする.移動距離が長く,当初予定よりも高い出張費が必要となる.
|
Research Products
(7 results)