分散型経路誘導システムを開発するための学習アルゴリズムの基礎的研究とその応用を目的とした研究であり、すべてのドライバーがこのアルゴリズムを利用した場合に実現する交通均衡について理論的に検討した。個々のドライバーは、日々の経験によって得る交通情報をもとに経路選択を実行する。目的地までの経路の所要時間は、他のドライバーの選択の影響を受けるため確率的に変動する。こうした状況において各ドライバーが自己の最適と思われる状態に達することができるかという問題である。結論は、自己の経験のみによって経路選択行動を繰り返す場合にもWardrop均衡に収束するというものである。この結論は、Wardrop均衡の前提になっていた経路に関する完全情報仮定を覆すものである。ただし、リンクのパフォーマンス関数が単調性を有し、すべてのドライバーの選好が同一の場合に限られる。また、収束のための学習プロセスは緩慢であり、長時間を必要とする。システムに錯乱があった場合の回復にも時間を要する。一方、トリップの終了後に利用可能な経路の情報が各ドライバーに伝達される場合には均衡への収束やシステムの不都合からの回復も効率性が上昇することが明らかになった。後者の場合、各ドライバーに経路情報が提供されるので、ドライバーは経路間の利得の比較が可能になる。このような場合には、ドライバーが実現しうる利得は、Wardrop均衡の場合よりも大きくなる。また、リンクのパフォーマンス関数の単調性を仮定しなくても安定した均衡状態へ収束する。このような状況はゲーム理論の分野では相関均衡と呼ばれており、従来の交通均衡概念にはなかった新しい概念である。本研究で提案されたアルゴリズムは個々のドライバーをベースにしている点で交通ネットワークモデルの新しい方向を提案しており、分散型経路誘導システムを可能にする新たな方向性を提案している。
|