研究課題/領域番号 |
22360201
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
土木計画学・交通工学
|
研究機関 | 東北大学 |
研究代表者 |
宮城 俊彦 東北大学, 大学院・情報科学研究科, 教授 (20092968)
|
研究分担者 |
福本 潤也 東北大学, 大学院・情報科学研究科, 准教授 (30323447)
|
研究期間 (年度) |
2010 – 2012
|
研究課題ステータス |
完了 (2012年度)
|
配分額 *注記 |
8,190千円 (直接経費: 6,300千円、間接経費: 1,890千円)
2012年度: 2,340千円 (直接経費: 1,800千円、間接経費: 540千円)
2011年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2010年度: 3,640千円 (直接経費: 2,800千円、間接経費: 840千円)
|
キーワード | 繰り返しゲーム / 強化学習 / 交通行動理論 / 適応学習アルゴリズム / Nash 均 衡 / 利用者均衡確率近似理論 / 動的離散的選択モデル / Nash均衡 / 利用者均衡 / 確率近似理論 / ゲーム理論 / 強化学習理論 / 実験経済学 / 経路選択行動 / リグレット基準 / ネットワーク均衡 / 離散的交通行動理論 / ロジット均衡 |
研究概要 |
ゲーム的学習理論を用いてエージェントの日々の経路選択行動を定式化し、不完全情報下における選択行動モデルを誘導するとともに、Nash均衡への収束性を理論的に明らかにしている。また、理論と整合的な適応学習アルゴリズムを開発し、アルゴリズムの妥当性について数値実験を用いて検証している。加えて、経路選択モデルの構造パラメータを推定する方法を提案した。室内実験によって得られたday-to-day経路選択データへの適用は満足いくものであった。
|