研究課題/領域番号 |
26420511
|
研究機関 | 岐阜大学 |
研究代表者 |
宮城 俊彦 岐阜大学, 工学部, フェロー (20092968)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 混雑ゲーム / 強化学習 / 利用者均衡 / 動的交通量配分 / 交通流シミュレーション / セルオートマトン / 粒子モデル / 短期交通管理政策 |
研究実績の概要 |
本研究は、交通ネットワークを利用する個々人を独立した意思決定者とみなしたゲーム論的経路選択モデルを扱っている。各ドライバーは日々の経路行動の結果得られる価値情報を基に行動学習しており、不確実な環境下においてもすべての個人を最善の状態に至らしめる行動ルール(選択関数)があると仮定している。行動モデルは、得られる価値情報の特性に応じて大きくpartially informed user(PIU)およびnaive user(NU)モデルに分類できる。 本年度は、より実際に近い交通環境下における経路選択学習モデルの検証を行うため、オープンソースの交通流シミュレーションソフト(SUMO)とPIUおよびNUアルゴリズムを統合するとともに、より一般的なネットワークに適用可能なように拡張し、その収束性を実証的に検証することを目標にしている。また、NUについては経路選択モデルを必要としない、いわゆるmodel-freeアプローチついて提案するとともにその有効性も併せて検証する。 成果は次のようである。1)open street mapから市街地道路を取りこみ、SUMOネットワーク作成ためのガイドラインを構築した。2)SUMOネットワークシミュレータに経路選択アルゴリズムを組み込むためのpythonプログラムを作成した(pythonSUMO)、3)PIUおよびNUの2つのアルゴリズムの収束性チェックを行った。アルゴリズムは、信号有のケースでも収束することを確認した。4)モデルフリーのアプローチは、経路選択の行動ルール(選択関数)を必要としないが、いくつかのパラメータをあらかじめ指定しておく必要がある。しかし、パラメータ設定を間違えると予想と異なる結果に導く場合が観測された。5)シミュレーションベースモデルでは完全な収束を得るためにはかなりの計算時間を必要とするが、停止基準を工夫すれば実用上差支えないレベルと判断できた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
統合モデルpythonSUMOについては比較的順調に進捗している。しかし、もう一つの目標であったロジットモデルのパラメータ推定とNash均衡を両立させるアルゴリズム開発については、課題を残している。すなわち、Bayes-Nash均衡を達成するnested pseudo-likelihood(NLP)法は2経路においては機能することを確認しているが、3経路以上への行動集合への拡張ではアルゴリズムが複雑になりすぎ、実用的ではない。大規模ネットワ上での多くの利用者を扱う、より実用性のあるアルゴリズム開発には、Nash均衡概念を緩和すると同時に、高次の非線形性を有する関数の統計的学習を可能にする新たな手法を取り込む必要がある。その方向に沿った手法として、deep learning(深層学習)がある。こうした手法を取り込む場合、新たな均衡概念が必要になる。相関均衡はNash均衡を含む緩い均衡概念であり、プレイヤーが学習で達成するのは、最善ではなく、経験学習に伴う最良選択である。
|
今後の研究の推進方策 |
open street networkからの地図データの作成そしてpythonSUMO上での実行が可能となるようにプログラム拡張を行う。また、経路学習アルゴリズムにおける学習概念を統計学的に達成するためのアルゴリズム開発を中心に行う。相関均衡は、プレイヤーの過去の学習に基づく最善策を見出す方法であり、深層学習などの教師あり学習に整合的である。本研究では、ネットワーク上の学習を、1)モデルのパラメータ学習および2)経路パターン学習の2つのタイプに絞り、その学習プロセスを研究する。1)は行動選択関数に含まれるパラメータを日頃の経路選択の繰り返しから得られるデータを教師データとして決定するモデルである。一方、2)はモデルフリーの経路選択行動を効率的に行うために、交通環境に応じた最適経路パターンを学習する関数を作成するアルゴリズム開発である。
|
次年度使用額が生じた理由 |
当初計画では、(株)テイコクの保有する3次元データマッピングシステムを利用して街路データ計測を基にした詳細地図データの作成を行い、シミュレーション用ネットワークにする予定であった。そのため3次元データマッピングシステム利用に伴う人件費・謝金を計上していたが、この方向での研究計画を断念したことによって未用途金が生じた。
|
次年度使用額の使用計画 |
シミュレーションベースのアルゴリズム開発においてPythonを用いたプログラムの統合化の必要が生じている。最終年度ではさらに大規模の統合シミュレーションプログラムを作成する必要があり、Pythonプログラム作成の協力依頼とそのための謝金に充当する予定である。
|