実世界応用を目指した汎用的なエージェント行動学習の研究
Project/Area Number |
20J15622
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Review Section |
Basic Section 61030:Intelligent informatics-related
|
Research Institution | Osaka Prefecture University |
Principal Investigator |
福島 卓弥 大阪府立大学, 人間社会システム科学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2020-04-24 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥1,700,000 (Direct Cost: ¥1,700,000)
Fiscal Year 2021: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2020: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | RoboCup / サッカーシミュレーション / マルチエージェント / 欠損値 / パーティクルフィルタ / 分散実行システム / 統計 / スポーツ科学 / ファジィ / 次元削減 |
Outline of Research at the Start |
現実環境(リアルタイムでの意思決定,予測できない未知の存在,動的な状態変化,欠損やノイズを含む不完全情報,連続的な状態空間,マルチエージェントなど)で人工知能を実用するためには,意思決定までの時間が短い即時性,あらゆる状況への汎用性,ノイズや欠損に対するロバスト性を保持しながら,人間を超える問題解決能力を獲得する必要がある.本研究では,このような現実環境に対して,実用可能な機械学習モデルを獲得することを目的とする.
|
Outline of Annual Research Achievements |
欠損やノイズに対するロバスト性獲得に対する取り組みとして,パーティクルフィルタに注目して研究を進めた.本年度に取り組んだ研究は,パーティクルフィルタにおける観測欠損に対するロバスト性を向上させるため,機械学習によって環境モデルを獲得する手法を提案した.環境依存の環境モデルを人手で調整する必要なく,観測欠損が生じる場合においても状態推定を継続することが可能になった.本手法が,欠損状態が生じうる現実問題に広く適用可能であることを確認するため,センサデータや画像情報を用いた物体追跡問題に取り組んだ.その結果,観測欠損における推定精度は向上し,不確実性を考慮可能な信念分布として十分に利用可能であることを確認した. また,本年度は汎用性に関する研究を進めた.昨年度に引き続き,敵の動きが分かった後自チームの行動ポリシーを決定するための手法について実装を進めた.行動ポリシーの決定には,行動間の相性を考慮して統計的に勝利が多いか否かを調査する必要がある.本研究で扱っている環境はノイズの多い環境であるため,統計的アプローチを導入するためには莫大な試行回数のシミュレーションを行う必要がある.この問題に対して,シミュレーションの分散実行システムを構築した.そしてこの分散実行システムを介して十分なシミュレーションを実行したうえでデータ分析を行うことで,エージェントの行動変化を統計的に確認した.統計的な根拠のもとで状況に応じた行動選択が可能になれば,汎用的な意思決定が実現可能となる.
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(9 results)