2015 Fiscal Year Annual Research Report
連続状態空間環境におけるロボット行動の評価方法と木構造を用いた連鎖行動探索
Project/Area Number |
24500241
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
中島 智晴 大阪府立大学, 工学(系)研究科(研究院), 教授 (20326276)
|
Co-Investigator(Kenkyū-buntansha) |
関 宏理 大阪大学, 基礎工学研究科, 助教 (10583693)
秋山 英久 福岡大学, 工学部, 助教 (20533201)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | RoboCup / ファジィ / エージェント / 機械学習 |
Outline of Annual Research Achievements |
自律的で知能的なロボットが実世界で与えられたタスクを完遂させるためには,複数の行動からなる行動連鎖を考えて意思決定しなければならない.実際のロボットが存在する空間は連続であるため,例えば,目標位置を伴うような行動は無限に行動の選択肢が存在する.本研究では,このような連続空間におけるロボット環境の行動連鎖に対する行動評価の方法について研究し,効果的な手法の開発を行う.また,複数の行動連鎖を探索するために,行動連鎖を木構造で表現することとし,最適な行動連鎖を効率的に探索するアルゴリズムを開発する. また,木構造による行動連鎖の評価方法として,単一入力ルール群ファジィシステムを用いる手法を提案した.単一入力ルール群ファジィシステムにより,敵プレーヤの移動予測が行われる.敵プレーヤの過去の移動軌跡をログファイルから必要な個所を抜き出し,学習用データとする.単一入力ルール群ファジィシステムを使用することにより,高速で正確な敵プレーヤの移動予測を行うことができる.この移動予測にもとづいて行動連鎖における評価値を計算することで,より確実な行動選択が可能となった. また,プレーヤ個人ではなく,チーム全体の戦略を解析する方法を提案した.敵戦略を完全に把握することは不可能であるが,どのような戦略をとったとしてもそれはボールをキックする場所や方向に現れるとの仮説の下に,ボールがキックされた位置とそのキック方向をキック分布として取り扱う方法を考案した.キック分布は通常のデータ分布とは違い,データ点に重みが付加されている.そこで,Earth Mover Distance を分布間の類似度を示す指標として用いることを提案し,キック分布からチーム戦略をクラスタリングにより分類することに成功した.
|