研究課題/領域番号 |
20J15622
|
研究種目 |
特別研究員奨励費
|
配分区分 | 補助金 |
応募区分 | 国内 |
審査区分 |
小区分61030:知能情報学関連
|
研究機関 | 大阪府立大学 |
研究代表者 |
福島 卓弥 大阪府立大学, 人間社会システム科学研究科, 特別研究員(DC2)
|
研究期間 (年度) |
2020-04-24 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
1,700千円 (直接経費: 1,700千円)
2021年度: 800千円 (直接経費: 800千円)
2020年度: 900千円 (直接経費: 900千円)
|
キーワード | RoboCup / サッカーシミュレーション / マルチエージェント / 欠損値 / パーティクルフィルタ / 分散実行システム / 統計 / スポーツ科学 / ファジィ / 次元削減 |
研究開始時の研究の概要 |
現実環境(リアルタイムでの意思決定,予測できない未知の存在,動的な状態変化,欠損やノイズを含む不完全情報,連続的な状態空間,マルチエージェントなど)で人工知能を実用するためには,意思決定までの時間が短い即時性,あらゆる状況への汎用性,ノイズや欠損に対するロバスト性を保持しながら,人間を超える問題解決能力を獲得する必要がある.本研究では,このような現実環境に対して,実用可能な機械学習モデルを獲得することを目的とする.
|
研究実績の概要 |
欠損やノイズに対するロバスト性獲得に対する取り組みとして,パーティクルフィルタに注目して研究を進めた.本年度に取り組んだ研究は,パーティクルフィルタにおける観測欠損に対するロバスト性を向上させるため,機械学習によって環境モデルを獲得する手法を提案した.環境依存の環境モデルを人手で調整する必要なく,観測欠損が生じる場合においても状態推定を継続することが可能になった.本手法が,欠損状態が生じうる現実問題に広く適用可能であることを確認するため,センサデータや画像情報を用いた物体追跡問題に取り組んだ.その結果,観測欠損における推定精度は向上し,不確実性を考慮可能な信念分布として十分に利用可能であることを確認した. また,本年度は汎用性に関する研究を進めた.昨年度に引き続き,敵の動きが分かった後自チームの行動ポリシーを決定するための手法について実装を進めた.行動ポリシーの決定には,行動間の相性を考慮して統計的に勝利が多いか否かを調査する必要がある.本研究で扱っている環境はノイズの多い環境であるため,統計的アプローチを導入するためには莫大な試行回数のシミュレーションを行う必要がある.この問題に対して,シミュレーションの分散実行システムを構築した.そしてこの分散実行システムを介して十分なシミュレーションを実行したうえでデータ分析を行うことで,エージェントの行動変化を統計的に確認した.統計的な根拠のもとで状況に応じた行動選択が可能になれば,汎用的な意思決定が実現可能となる.
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|