2012 Fiscal Year Research-status Report
連続状態空間環境におけるロボット行動の評価方法と木構造を用いた連鎖行動探索
Project/Area Number |
24500241
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
中島 智晴 大阪府立大学, 工学(系)研究科(研究院), 教授 (20326276)
|
Co-Investigator(Kenkyū-buntansha) |
関 宏理 関西学院大学, 理工学部, 契約助手 (10583693)
秋山 英久 福岡大学, 工学部, 助教 (20533201)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 知能ロボット / RoboCupサッカー |
Research Abstract |
多属性からスカラー値への非線形マッピングモデリングとその意思決定への応用.まず,本研究の第一段階として,多属性入力からスカラー値への非線形モデリング手法の研究開発を行う.非線形写像関数が滑らかなモデリング手法を提案した.理論的,実験的観点から関数の連続性を検証し,実行可能性を示した.ただし,モデリング手法には改善の余地が大きく残されており,引き続き研究が行われなければならない.非線形マッピングのモデリング支援手法.非線形モデリング手法を考えた.具体的には,SIRMs ファジィ推論モデルによる非線形モデリング手法を考えた.従来の SIRMs ファジィ推論ではルール群重みは実数値であったが,これを線形関数に拡張し,学習用パターンに基づく二乗誤差の和を最小化するためのデルタルールを導出することができた.この関数重み型 SIRMs により,より柔軟な非線形モデリングが可能となった. オンラインでチームフォーメーションを考慮することができる手法について提案した.泥ねー図に基づくチームフォーメーションアルゴリズムを RoboCup に適用し,その有効性について検証した.また,行動連鎖における意思決定の振動を抑えるために,将来の時点における評価関数を減少させる方法について議論した.現象の方法は非線形関数を用い,現在の状態よりも時刻が離れていればより評価値を低くし,逆に位置関係が現在と近い場合には評価関数の減少を抑えるような非線形関数を考え,提案手法に導入した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
非線形モデリング手法である SIRMs ファジィ推論モデルの開発が順調に進み,多属性入力から単一出力へのマッピングとなるモデルの学習アルゴリズムを確立することができた.さらに,この学習モデルを拡張して精度を向上させる見込みもあり,将来有望なモデルができたと考えられる. オンラインフォーメーション技術が向上したことにより,行動連鎖における表価値計算の安定性が増すことが期待できる.このことにより本研究の目標へさらに近づいたということができる.
|
Strategy for Future Research Activity |
最適な行動連鎖を探索するためのアルゴリズムの開発に取り組む.行動連鎖を木構造としたときに探索量が獲得ゴールに与える影響を調査した予備実験により,行動木を深さ優先で探索して,探索量を多くすると獲得ゴール数が増える傾向にあることがわかっている.限られた探索時間内でできるだけ多くの行動連鎖を評価できる行動表現が必要となる.以下のサブテーマを設定し,研究を進める. i) 行動連鎖に対する木構造表現の有効性調査 行動連鎖を効率的に探索するための表現方法について,理論的・実験的観点からの考察を行う.具体的には,行動連鎖を探索する際に分岐を明確に考慮して探索したほうが良いのか,それとも行動の連鎖を一つのパターンとして考えて分岐を一切考慮しなくても良いのかについて,実時間内で収まる計算量であるのか,最適値発見までの期待計算量を理論的に考察し,数値実験により理論的考察の妥当性を検証する. ii) ランダム探索による行動連鎖の有効性調査 RoboCup では最大探索時間0.1 秒という制約があり,限られた時間内でできるだけ良い行動連鎖を探索する必要がある. i) の研究成果を踏まえて,行動連鎖探索に関する本格的な研究を開始する.まずはランダム探索による行動連鎖の有効性調査を行う.有限時間ランダムサンプリングの探索網羅性や行動連鎖の質の検証を行う.有限時間内で最適解を得る可能性を高めるための近傍探索やタブー探索の利用も考慮する
|
Expenditure Plans for the Next FY Research Funding |
非線形モデリング手法が大規模データに対しても適用可能であるような,大容量メモリと大容量ハードディスクを要する高速計算機を購入する. また,これまでの研究成果を国内国外で開催される学術研究会にて発表するため,旅費として使用する.
|
Research Products
(7 results)