研究課題/領域番号 |
17K01746
|
研究機関 | 福岡大学 |
研究代表者 |
秋山 英久 福岡大学, 工学部, 助教 (20533201)
|
研究分担者 |
中島 智晴 大阪府立大学, 現代システム科学域, 教授 (20326276)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | サッカー / シミュレーション / 行動計画モデル / 戦術指示モデル |
研究実績の概要 |
本年度は、連鎖的行動列生成モデルの拡張、評価関数学習モデルの改良の検討、戦術指示インタフェースのプロトタイプ開発を進めた。 連鎖的行動列生成モデルの拡張として、他者の意図推定を行うことで協調行動を促進するアプローチを試みた。具体的には、ボールを持っていない選手がボールを持っている選手と同様の行動列生成計算を行い、次にパスが出される地点を予測する。ボールを持っている選手の意図を推定することで、ボールを持っていない選手はパスを受ける動きをより早い段階で開始することが可能となる。実験に、最初に計画した行動列の実現率の改善が確認できた。
評価関数学習モデルの改良として、以前から取り組んできたランキング学習を用いたアプローチの有効性を確認する実験を進めた。具体的には、RoboCupサッカーシミュレータに組み込まれているKeepawayサブタスクへ適用することで、学習による性能改善をより明確に確認することができた。また、教師あり学習と強化学習を組み合わせて評価関数を学習する手法を提案した。実験によって、既存のサンプルチームと同等のチーム性能を発揮する評価関数を提案手法で獲得できることを確認した。
戦術指示インタフェースのプロトタイプとして、ランク学習のための指示インタフェース開発、また、VRヘッドマウントディスプレイを用いた没入型のビューワ開発を進めた。具体的には、教示者がGUI上で望ましい行動列を選択するだけでランク学習のための訓練データが生成されるインタフェースを開発した。また、没入型ビューワによって、被験者の首の向きをシミュレータ内での選手の首の向きとして記録することが可能となった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
行動計画モデルの改良に関して、連鎖的行動列生成モデルの拡張、評価関数を学習するモデルに関する研究を行った。連鎖的行動列生成モデルについては、当初計画していた移動行動の生成には至らなかったものの、より効果的な移動行動を促すための既存手法の応用を実現した。評価関数の学習については、当初計画していたランキング学習に加えて、ニューラルネットワークを用いた教師あり学習と強化学習を組み合わせた手法を検討した。また、戦術指示インタフェースとして、ランキング学習のための訓練データを作成するGUIプログラムのプロトタイプを開発した。当初の計画どおり、人間の教示者が望む行動列に対してマークを付けるだけで訓練データ生成を可能とする手法を提案した。ただし,マークされていない行動列の選択基準については引き続き今後の課題である。
戦術指示モデルの設計とインタフェース開発の一環として、VRヘッドマウントディスプレイを用いた没入型ビューワを開発した。現時点では、シミュレータが記録したログをVRヘッドマウントディスプレイで再生し、人間がシミュレーションサッカーの空間へ没入しつつ、人間の首振り行動のロギングが可能となっている。これは当初の計画には含まれなかったものであるが、人間の意思決定をより自然にロギングする方法の一つとして有用と考えられる。本年度はタッチパネルを用いた戦術指示インタフェースの開発までは至っておらず、通常のGUIプログラムでの開発にとどまっている。協調的行動パターンのデザイン機能についても検討中の段階である。視線トラッカーを用いた注目情報システムに関しては、視線トラッカーデバイスを入手し、動作確認と設計を検討中の段階である。
|
今後の研究の推進方策 |
引き続き行動計画モデルの改良を進める。当初の計画に沿って、行動列生成モデルにおいて選手の移動行動を含めた生成モデルを検討する。計算負荷の増大が予想されるため、初年度に購入した計算機を用いた分散実行システムの構築を並行して進める。評価関数学習モデルについては、ランキング学習を用いたアプローチにおいて、特徴量やハイパーパラメータを実験的に調査していく。また、サッカーにおけるサブタスクを定義し、そのサブタスクに限定して学習させることでモデルの性能を定量的に評価していく。 戦術指示モデルの設計とインタフェース開発の一環として、VRヘッドマウントディスプレイを用いた没入型ビューワを拡張し、戦術指示入力インタフェースとしての機能を充実させていく。VRヘッドマウントディスプレイに視線トラッカーを組み込むことで、当初予定していた注目情報収集システムとの統合を図る。また、当初の計画に沿った戦術指示インタフェースの開発を並行して進める。視線トラッカーを用いた注目情報収集システムについては、シミュレータとは独立して視線トラッカー単体で先行して視線情報収集実験を開始する。
|
次年度使用額が生じた理由 |
次年度に遠方の海外出張が予定されたため、次年度の海外出張経費の見積額が確定するまで物品費・人件費への使用を控えた。これ以外は当初予定から大きな変更は無い。
|