2021 Fiscal Year Annual Research Report
実世界応用を目指した汎用的なエージェント行動学習の研究
Project/Area Number |
20J15622
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
福島 卓弥 大阪府立大学, 人間社会システム科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2020-04-24 – 2022-03-31
|
Keywords | RoboCup / サッカーシミュレーション / マルチエージェント / 欠損値 / パーティクルフィルタ / 分散実行システム / 統計 / スポーツ科学 |
Outline of Annual Research Achievements |
欠損やノイズに対するロバスト性獲得に対する取り組みとして,パーティクルフィルタに注目して研究を進めた.本年度に取り組んだ研究は,パーティクルフィルタにおける観測欠損に対するロバスト性を向上させるため,機械学習によって環境モデルを獲得する手法を提案した.環境依存の環境モデルを人手で調整する必要なく,観測欠損が生じる場合においても状態推定を継続することが可能になった.本手法が,欠損状態が生じうる現実問題に広く適用可能であることを確認するため,センサデータや画像情報を用いた物体追跡問題に取り組んだ.その結果,観測欠損における推定精度は向上し,不確実性を考慮可能な信念分布として十分に利用可能であることを確認した. また,本年度は汎用性に関する研究を進めた.昨年度に引き続き,敵の動きが分かった後自チームの行動ポリシーを決定するための手法について実装を進めた.行動ポリシーの決定には,行動間の相性を考慮して統計的に勝利が多いか否かを調査する必要がある.本研究で扱っている環境はノイズの多い環境であるため,統計的アプローチを導入するためには莫大な試行回数のシミュレーションを行う必要がある.この問題に対して,シミュレーションの分散実行システムを構築した.そしてこの分散実行システムを介して十分なシミュレーションを実行したうえでデータ分析を行うことで,エージェントの行動変化を統計的に確認した.統計的な根拠のもとで状況に応じた行動選択が可能になれば,汎用的な意思決定が実現可能となる.
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|