研究概要 |
本課題では,交通流を情報提供によって制御することを目指して(1)動的な環境における情報の不確実性と,(2)得られた情報に対する運転者の行動規範の2つに着目した情報ネットワーク構成法の確立を進めている.H22年度は(1)に関する情報の不完全性,不確実性の下での推論や適応行動を単独の人間(シングルエージェント)を対象に考察してきた. H23年度は,H22年度の知見に基づいて,(2)の運転者の行動規範と,運転者群の制御方法に関する研究を以下の手順で進め,それぞれ成果を得ている: 1.複数の人間の意思決定を進化ゲームにについてモデル化し,(成果:インフルーエンサ導入) 2.各人の目的地(目標)を実施する上での競合や,利己的,合理的な行動選択によって生じる社会的ジレンマをシミュレーションによって再現,(成果:Braess's Paradoxを生む交通流制御) 3.ジレンマ解消方法として,ネットワーク構造と意思決定戦略の操作が有効であることを実験によって示し,これを説明するための数理モデルを構築.(成果:確率ゲームとChasmモデル) 4.さらに,3.のモデルをベースにして,マルチエージェント系全体を最適な挙動へと「ボトムアップに」導くためのメカニズム設計(報酬設定)の提案.(成果:マルチエージェント環境下での逆強化学習) 以上の成果は,望ましい(最適は保証できないが,得られる情報の範囲において最も適切な)交通流の実現問題に対して以下の課題を可能にした.すなわち,1.は複数の異なる目的(旅行時間最短化,料金最小化)を持つ主体間の適応的意思決定をルールとして抽出すること,2.においてはこれらのルールによって生じうる競合パターンの検出,3.ではその解消方法,4.では解消をボトムアップに実現する制御方法を考えることを可能にしH24の計画を進める上での重要な基盤となっている.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
H22-23までの成果は,H24までの研究期間の到達目標であるI.環環入力範囲が意思決定に与える影響の分析,II.意思決定規範の相違が系全体の挙動に与える影響の分析,III.運転者への情報提供を制御設計法の確立において重要な基礎理論を与え,その応用が可能であることまでを示しており,最終年度であるH24では情報ダイナミクスの解析と交通流の制御実現に向けて良好な進捗状況である.
|
今後の研究の推進方策 |
H23年度までの知見から,当初考えていなかったアプローチである逆強化学習(lnverse Reinforcement leaming)および粒子群最適化(Particle swrmOptimization)の導入が,人の意思決定戦略を制御するインセンティブの設計,および,意思決定空間(効用の解空間)における最適均衡点を探索する方法として有効であることがわかってきた.H24年度はミクロシミュレータを用いてこれまでの理論モデルを検証する予定であるが,併せて上述した逆強化学習と粒子群最適化法を導入した理論解析まで進めることを追加目標とする.
|