2011 Fiscal Year Annual Research Report

望ましい交通流の実現に向けた情報ダイナミクスの解析と設計

Research Project

Project/Area Number	22500120
Research Institution	Chiba University
Principal Investigator	荒井幸代千葉大学, 大学院・工学研究科, 准教授 (10372575)
Co-Investigator(Kenkyū-buntansha)	吉村忍東京大学, 工学(系)研究科, 教授 (90201053) 丸山喜久千葉大学, 大学院・工学研究科, 准教授 (70397024)
Keywords	マルチエージェント / 戦略的意思決定 / 強化学習 / 認知モデル / 複雑ネットワーク / リスク評価
Research Abstract	本課題では,交通流を情報提供によって制御することを目指して(1)動的な環境における情報の不確実性と,(2)得られた情報に対する運転者の行動規範の2つに着目した情報ネットワーク構成法の確立を進めている.H22年度は(1)に関する情報の不完全性,不確実性の下での推論や適応行動を単独の人間(シングルエージェント)を対象に考察してきた. H23年度は,H22年度の知見に基づいて,(2)の運転者の行動規範と,運転者群の制御方法に関する研究を以下の手順で進め,それぞれ成果を得ている: 1.複数の人間の意思決定を進化ゲームにについてモデル化し,(成果:インフルーエンサ導入) 2.各人の目的地(目標)を実施する上での競合や,利己的,合理的な行動選択によって生じる社会的ジレンマをシミュレーションによって再現,(成果:Braess's Paradoxを生む交通流制御) 3.ジレンマ解消方法として,ネットワーク構造と意思決定戦略の操作が有効であることを実験によって示し,これを説明するための数理モデルを構築.(成果:確率ゲームとChasmモデル) 4.さらに,3.のモデルをベースにして,マルチエージェント系全体を最適な挙動へと「ボトムアップに」導くためのメカニズム設計(報酬設定)の提案.(成果:マルチエージェント環境下での逆強化学習) 以上の成果は,望ましい(最適は保証できないが,得られる情報の範囲において最も適切な)交通流の実現問題に対して以下の課題を可能にした.すなわち,1.は複数の異なる目的(旅行時間最短化,料金最小化)を持つ主体間の適応的意思決定をルールとして抽出すること,2.においてはこれらのルールによって生じうる競合パターンの検出,3.ではその解消方法,4.では解消をボトムアップに実現する制御方法を考えることを可能にしH24の計画を進める上での重要な基盤となっている.
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason H22-23までの成果は,H24までの研究期間の到達目標であるI.環環入力範囲が意思決定に与える影響の分析,II.意思決定規範の相違が系全体の挙動に与える影響の分析,III.運転者への情報提供を制御設計法の確立において重要な基礎理論を与え,その応用が可能であることまでを示しており,最終年度であるH24では情報ダイナミクスの解析と交通流の制御実現に向けて良好な進捗状況である.
Strategy for Future Research Activity	H23年度までの知見から,当初考えていなかったアプローチである逆強化学習(lnverse Reinforcement leaming)および粒子群最適化(Particle swrmOptimization)の導入が,人の意思決定戦略を制御するインセンティブの設計,および,意思決定空間(効用の解空間)における最適均衡点を探索する方法として有効であることがわかってきた.H24年度はミクロシミュレータを用いてこれまでの理論モデルを検証する予定であるが,併せて上述した逆強化学習と粒子群最適化法を導入した理論解析まで進めることを追加目標とする.

Research Products
(27 results)

All 2012 2011

All Journal Article (15 results) (of which Peer Reviewed: 4 results) Presentation (12 results)

[Journal Article] マルチエージェント交通流シミュレーションにおける交通事故モデリング2012
- Author(s)
  藤井秀樹, 吉村忍, 高野悠哉
- Journal Title
  
  人工知能学会論文誌
  
  Volume: 26 Pages: 42-49
- Peer Reviewed
[Journal Article] 集団のジレンマを解消する相互監視ネットワーク形成アルゴリズム2012
- Author(s)
  野村一平, 荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門,知能システムシンポジウム講演論文集
  
  Volume: 第39回 Pages: 1-6
[Journal Article] 逆強化学習を用いた最適行動を促すインセンティブの推定2012
- Author(s)
  大喜多周, 荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門,知能システムシンポジウム講演論文集
  
  Volume: 第39回 Pages: 115-120
[Journal Article] 逆強化学習の導入による社会規範の誘発2012
- Author(s)
  鈴木香名子, 荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門,知能システムシンポジウム講演論文集
  
  Volume: 第39回 Pages: 227-232
[Journal Article] 学習ペースカーによるメタ安定相への遷移効果2012
- Author(s)
  許海遅, 荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門,知能システムシンポジウム講演論文集
  
  Volume: 第39回 Pages: 225-230
[Journal Article] Learning Strategic Information Support for Controlling Traffic Flow2011
- Author(s)
  Sachiyo Arai, Yuta Mabuchi
- Journal Title
  
  Proceedings of International Conference on Intelligent Unmanned Systems 2011
  
  Volume: (USB) Pages: 6
- Peer Reviewed
[Journal Article] A Study of Traffic Flow Optimization by Learning Pace-car2011
- Author(s)
  Sachiyo Arai, Tatsuya Masubuchi
- Journal Title
  
  Proceedings of the 15th Asia Pacific Symposium on Intelligent and Evolutionary Systems
  
  Volume: (DVD) Pages: 6
- Peer Reviewed
[Journal Article] Interaction Model for Chasm Creation on Multiagent Network2011
- Author(s)
  Shuichiro Kanno, Sachiyo Arai
- Journal Title
  
  Proceedings of the SICE Annual Conference 2011
  
  Volume: (USB) Pages: 6
- Peer Reviewed
[Journal Article] ランダムタイリングの逐次改善による状態空間の分割2011
- Author(s)
  大久保有基, 荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門学術講演会2011講演論文集
  
  Volume: SSI2011 Pages: 111-116
[Journal Article] 報酬関数の設計に関する研究事例2011
- Author(s)
  荒井幸代
- Journal Title
  
  計測自動制御学会システム・情報部門学術講演会2011講演論文集
  
  Volume: SSI2011 Pages: 57-60
[Journal Article] 意思決定規範の相違によるInfuencer導入効果の考察2011
- Author(s)
  栗山俊通, 荒井幸代
- Journal Title
  
  平成23年電気学会,電子・情報・システム部門大会講演論文集
  
  Volume: 2011 Pages: TC10-4(6pages)
[Journal Article] 強化学習エージェントの状態認識制御が交通流に与える影響2011
- Author(s)
  間渕雄太, 荒井幸代
- Journal Title
  
  平成23年電気学会,電子・情報・システム部門大会講演論文集
  
  Volume: 2011 Pages: TC6-3(6pages)
[Journal Article] 系のジレンマ環境解消のためのInfluencerの導入とその配置法の考察2011
- Author(s)
  栗山俊通, 荒井幸代
- Journal Title
  
  第24回人工知能学会全国大会論文集
  
  Volume: 2011 Pages: 3C1-OS14-7(6pages)
[Journal Article] 制御策に対する運転者の意思決定が交通流に与える影響2011
- Author(s)
  間渕雄太, 荒井幸代
- Journal Title
  
  第24回人工知能学会全国大会論文集
  
  Volume: 2011 Pages: 3J2-OS10-4(6pages)
[Journal Article] 首都圏における地震後の道路交通シミュレーションに向けた基礎検討2011
- Author(s)
  小山哲迪, 丸山喜久
- Journal Title
  
  首都圏における地震後の道路交通シミュレーションに向けた基礎検討
  
  Volume: 2011 Pages: 63-66
[Presentation] 強化学習エージェントの状態認識制御が交通流に与える影響2011
- Author(s)
  間渕雄太,荒井幸代
- Organizer
  平成23年電気学会,電子・情報・システム部門大会
- Place of Presentation
  富山
- Year and Date
  20110907-09
[Presentation] A Study of Traffic Flow Optimization by Learning Pace-car2011
- Author(s)
  Sachiyo Arai
- Organizer
  Evolutionary Computation
- Place of Presentation
  Yokosuka,Kanagawa
- Year and Date
  2011-12-08
[Presentation] 報酬関数の設計に関する研究事例,A New Optimal Reward Framework to Design Good Primary Reward Function2011
- Author(s)
  荒井幸代
- Organizer
  計測自動制御学会システム・情報部門学術講演会2011
- Place of Presentation
  東京(招待講演)
- Year and Date
  2011-11-21
[Presentation] Semi-automated Reconfguration of Tile for State Representation2011
- Author(s)
  荒井幸代
- Organizer
  計測自動制御学会システム・情報部門学術講演会2011
- Place of Presentation
  東京
- Year and Date
  2011-11-21
[Presentation] Learning Strategic Information Support for Controlling Traffic Flow2011
- Author(s)
  Sachiyo Arai
- Organizer
  IEEE, SICE
- Place of Presentation
  千葉
- Year and Date
  2011-10-31
[Presentation] Interaction Model for Chasm Creation on Multiiagent Network2011
- Author(s)
  Sachiyo Arai
- Organizer
  計測自動制御学会,IEEE
- Place of Presentation
  東京
- Year and Date
  2011-09-13
[Presentation] 意思決定規範の相違によるInfuencer導入効果の考察2011
- Author(s)
  荒井幸代
- Organizer
  平成23年電気学会,電子・情報・システム部門大会
- Place of Presentation
  富山(招待講演)
- Year and Date
  2011-09-08
[Presentation] Evaluation Criterion for Reconfiguration of Tile in Random Tiling2011
- Author(s)
  荒井幸代
- Organizer
  第17回創発システムシンポジウム/計測自動制御学会
- Place of Presentation
  米原
- Year and Date
  2011-09-05
[Presentation] 学習ペースカーによるメタ安定相への遷移効果2011
- Author(s)
  許海遅, 荒井幸代
- Organizer
  計測自動制御学会システム・情報部門知能工学部会
- Place of Presentation
  千葉
- Year and Date
  2011-03-16
[Presentation] 集団のジレンマを解消する相互監視ネットワーク形成アルゴリズム2011
- Author(s)
  野村一平, 荒井幸代
- Organizer
  計測自動制御学会システム・情報部門知能工学部会
- Place of Presentation
  千葉
- Year and Date
  2011-03-15
[Presentation] 逆強化学習を用いた最適行動を促すインセンティブの推定2011
- Author(s)
  大喜多周, 荒井幸代
- Organizer
  計測自動制御学会システム・情報部門知能工学部会
- Place of Presentation
  千葉
- Year and Date
  2011-03-15
[Presentation] 逆強化学習の導入による社会規範の誘発2011
- Author(s)
  鈴木香名子, 荒井幸代
- Organizer
  計測自動制御学会システム・情報部門知能工学部会
- Place of Presentation
  千葉
- Year and Date
  2011-03-15

2011 Fiscal Year Annual Research Report

望ましい交通流の実現に向けた情報ダイナミクスの解析と設計

Principal Investigator

荒井 幸代 千葉大学, 大学院・工学研究科, 准教授 (10372575)

Current Status of Research Progress

Reason

Research Products

[Journal Article] マルチエージェント交通流シミュレーションにおける交通事故モデリング2012

Author(s)

Journal Title

[Journal Article] 集団のジレンマを解消する相互監視ネットワーク形成アルゴリズム2012

Author(s)

Journal Title

[Journal Article] 逆強化学習を用いた最適行動を促すインセンティブの推定2012

Author(s)

Journal Title

[Journal Article] 逆強化学習の導入による社会規範の誘発2012

Author(s)

Journal Title

[Journal Article] 学習ペースカーによるメタ安定相への遷移効果2012

Author(s)

Journal Title

[Journal Article] Learning Strategic Information Support for Controlling Traffic Flow2011

Author(s)

Journal Title

[Journal Article] A Study of Traffic Flow Optimization by Learning Pace-car2011

Author(s)

Journal Title

[Journal Article] Interaction Model for Chasm Creation on Multiagent Network2011

Author(s)

Journal Title

[Journal Article] ランダムタイリングの逐次改善による状態空間の分割2011

Author(s)

Journal Title

[Journal Article] 報酬関数の設計に関する研究事例2011

Author(s)

Journal Title

[Journal Article] 意思決定規範の相違によるInfuencer導入効果の考察2011

Author(s)

Journal Title

[Journal Article] 強化学習エージェントの状態認識制御が交通流に与える影響2011

Author(s)

Journal Title

[Journal Article] 系のジレンマ環境解消のためのInfluencerの導入とその配置法の考察2011

Author(s)

Journal Title

[Journal Article] 制御策に対する運転者の意思決定が交通流に与える影響2011

Author(s)

Journal Title

[Journal Article] 首都圏における地震後の道路交通シミュレーションに向けた基礎検討2011

Author(s)

Journal Title

[Presentation] 強化学習エージェントの状態認識制御が交通流に与える影響2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] A Study of Traffic Flow Optimization by Learning Pace-car2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 報酬関数の設計に関する研究事例,A New Optimal Reward Framework to Design Good Primary Reward Function2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Semi-automated Reconfguration of Tile for State Representation2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Learning Strategic Information Support for Controlling Traffic Flow2011

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Interaction Model for Chasm Creation on Multiiagent Network2011

Author(s)

Organizer

荒井幸代千葉大学, 大学院・工学研究科, 准教授 (10372575)