2014 Fiscal Year Research-status Report
連続状態空間環境におけるロボット行動の評価方法と木構造を用いた連鎖行動探索
Project/Area Number |
24500241
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
中島 智晴 大阪府立大学, 工学(系)研究科(研究院), 教授 (20326276)
|
Co-Investigator(Kenkyū-buntansha) |
関 宏理 関西学院大学, 理工学部, 契約助手 (10583693)
秋山 英久 福岡大学, 工学部, 助教 (20533201)
|
Project Period (FY) |
2012-04-01 – 2016-03-31
|
Keywords | RoboCup / ファジィシステム / 行動連鎖 / エージェント |
Outline of Annual Research Achievements |
行動連鎖の成功率を高めるための性能改善を機械学習技術により達成した.具体的には,行動連鎖生成における将来状態の予測を行うためのファジィシステムを提案した.SIRMs はボールの位置などの情報から敵位置へのマッピングを行っている.オンライン学習により競技前半の情報を使って敵位置の情報を収集し,前半終了後の休憩時に SIRMs モデルを学習し,競技後半に学習後の SIRMs を用いて将来状態予測を行った結果,生成された行動連鎖の成功確率が向上した. チームの戦略の質を高める次のステップとして,敵チームの戦略を解析し,それに応じて自チームの戦略を変更するための枠組みが必要である.具体的には,過去の試合をすべて調べ,チーム戦略をいくつかのパターンに分類する技術と,各パターンに対する必勝法を機械学習技術により獲得する手法,それから試合中に敵チームの戦略を即座に分析してパターン化する技術,さらにそのパターンに応じて自チームが用意した戦略のうちどれが最適であるかを見分ける技術が必要である.これらは非常に大きな枠組みになることが予想されるため,まずは過去の試合データを用いて戦略をグルーピングする手法に注目することにした.チーム戦略がキック分布で表現されているという仮定の下,試合における自チームのキック分布,敵チームのキック分布,さらに両チーム合わせたキック分布の3種類を用いてクラスタリングすることにより戦略のパターン分析を試みた.勝敗がきれいに分かれるようなパターン分類ができていることがこれまでに分かった.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
行動連鎖の質を高めるために状態予測における性能が改善した.これにより木構造による行動連鎖探索がより良い方向に向かっている.
|
Strategy for Future Research Activity |
行動連鎖の木構造の質を高めるためには,敵チームの戦略を組むことが次のステップとして考えられる.そこで,敵チームの戦略を分析する手法を考える必要がある.敵チームの戦略を分析するための情報として,キック分布を用いたチーム戦略分析を考えることにする.
|
Causes of Carryover |
行動連鎖探索のための木構造構築の質により改善の余地があることがわかり,アイデアを共同研究者と共に考えるための打ち合わせ費用が想定よりも多くなった.
|
Expenditure Plan for Carryover Budget |
木構造の質改善のためのアルゴリズムを考案し,それを実装するための計算機設備を購入するとともに研究発表に要する学会参加のための旅費や論文印刷費として使用する.
|
Research Products
(9 results)