研究課題/領域番号 |
18560519
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
交通工学・国土計画
|
研究機関 | 東北大学 (2007) 岐阜大学 (2006) |
研究代表者 |
宮城 俊彦 東北大学, 大学院・情報科学研究科, 教授 (20092968)
|
研究期間 (年度) |
2006 – 2007
|
研究課題ステータス |
完了 (2007年度)
|
配分額 *注記 |
3,220千円 (直接経費: 2,800千円、間接経費: 420千円)
2007年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2006年度: 1,400千円 (直接経費: 1,400千円)
|
キーワード | Wardrop均衡 / Hannan一致性 / Nash均衡 / 接近性定理 / 強化学習 / 適応学習 / 繰り返しゲーム / マルコフ意思決定過程 / Hannan均衡 / 交通均衡 |
研究概要 |
この研究は、分散型ナビゲーション・システムを開発するための学習アルゴリズムの基礎的研究である。研究は理論的および数値分析の両面から行われた。すべてのドライバーがこのアルゴリズムを使用したときに実現する交通均衡の特性について興味ある結果を得た。我々のアプローチの基本的な仮定は、個々のドライバーがその人の毎日の経験によって得られる旅行情報に基づきルート選択を行っているというものである。旅行情報(たとえば起点からの目的地までの旅行時間)は、他のドライバーの選択に影響を受けるために、確率的に変動する。そのような状況でさえ、彼がリグレット・マッチングによってルートを選ぶならば、各々のドライバーはある安定した状態に達することができる。この結論は、ドライバーの完全な情報を仮定した従来のウォードロップ均衡概念とはかなり異なる。この結論は、慎重に設計された情報獲得システムがあれば、それによってドライバーに対して最善ルートに知らせることができ、同時にシステムを安定させることができることを意味する。この場合の核となるエンジンをインテリジェント・ドライビング・アルゴリズムと呼ぶ。このアルゴリズムは、マルコフ決定プロセスとリグレット・マッチング・アルゴリズムの組合せから構成される。数値計算の効率性は近似的動的計画法と確率近似算理論に依存する。単純なネットワークではあるが、現実的なリンクコスト関数を用いた計算例では良い結果を得たが、収束効率性は悪かった。この研究の結論は、個々のドライバーがGPSを使用することで自身によって旅行情報を集め、機械学習によってより良いルートへ自動的に案内されるような、分散型車両ナビゲーション・システムの可能性を提示している。
|