研究課題/領域番号 |
20K04719
|
研究機関 | 岐阜大学 |
研究代表者 |
宮城 俊彦 岐阜大学, 工学部, 特任教授 (20092968)
|
研究分担者 |
倉内 文孝 岐阜大学, 工学部, 教授 (10263104)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 交通流シミュレーションモデル / 強化学習 / 深層学習 / 漸近的最適応答 / 一般化弱仮想プレイ / 確率近似理論 / リカレントニューラルネットワーク / Day-to-day 動的配分 |
研究実績の概要 |
漸近的最適応答モデル(以下ABRモデル)とは、個々のエージェントの経路選択における自己学習過程をゲーム理論の一般化弱仮想プレイとしてモデル化したものであり,エージェントに事前の知識が無く,自己の経験だけに基づいて経路選択を繰り返す場合に実現するネットワーク状態を予測するモデルである.この場合の運動ダイナミックスは微分包含で記述され,ネットワークの安定性は微分包含の特性分析によって行える.本研究では、外部環境をセンサーで観測可能な車両をエージェントと呼び、エージェントは日々の走行経験を通して得られる経路情報を利用して行動・状態関数のパラメータを推定・調整する。行動は、出発時刻選択、経路選択そして車線変更を含むが、本年度は、車線変更・経路選択のみを行動変数と定義している。この場合、システムの状態変数は、車線変更に関しては、エージェントの車両速度、前方車両との距離そして追い越し車線での車間距離である。また、経路選択については離散変数になる。車線変更状態変数と車線変更の関数関係は走行経験から学習する。一般の追い越しシミュレーションモデルは、安全車間距離ならば確実に追い越し行動をとるが、安全視距を大きくとると、追い越しの無駄が生じ、あまりにも小さくとる追突の危険やショックウェーブによる速度低下の原因となる。すでに作成した経路変更シミュレーションモデルを用いて車線変更状態変数に係るパラメータを深層学習で推定した。経路選択行動を含まない場合は、比較的容易に行動学習ができ、安定交通流を形成することができるが、経路選択を含む同時推定の場合には、均衡解の安定性が不十分であるという問題に直面し、アルゴリズムを再検討している段階にある。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
状態・行動関数のパラメータを推定するためのニューラルネットワークモデルについては、行動変数を車線変更に限定した場合については、走行経験を通したパラメータ推定には成功している。しかし、経路選択行動を含む拡張モデルについては、達成されるはずのロジット均衡が不十分である。これは、シミュレーションアルゴリズムの欠陥によるのか、一般化仮想プレイによる均衡が無数に存在するためなのか、計算手法および理論の両面から解明する必要がある。また、シミュレーションアルゴリズムについても利用する最適化手法の精度に依存する部分もあるため検討課題とする。
|
今後の研究の推進方策 |
現在直面している問題のうちシミュレーションアルゴリズムの開発に関連するところは、深層学習を用いたパラメータ推定に関連する部分と確率近似のパラメータ設定に関わる問題点に分解できる。特に、前者に関わるところでは、非線形性が極度に最適化にひずみを与え、パラメータ推定が十分機能していないことも考えられる。こうした問題に対応するには、評価の高いソフトを利用するしか対処の方法がない。パラメータを変更してシミュレーション回数を増やす方向での対処を考えている。
|
次年度使用額が生じた理由 |
コロナ禍、予定した国内学会、国際会議出席を取りやめたことが一番の原因である。次年度は、国内学会・国際学会とも出席予定であり、新たに購入する予定のソフトウエアと併せて当初予定通り使用する計画である。
|