安定・安全を指向する逆強化学習に基づく運転行動モデリング

研究課題

研究課題/領域番号	21H03517
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
審査区分	小区分61050:知能ロボティクス関連
研究機関	東京工業大学
研究代表者	下坂正倫東京工業大学, 情報理工学院, 准教授 (40431796)
研究分担者	小竹元基東京工業大学, 工学院, 教授 (10345085)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	17,030千円 (直接経費: 13,100千円、間接経費: 3,930千円) 2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円) 2022年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円) 2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
キーワード	逆強化学習 / 運転行動モデリング / 経路生成 / RRT / 運転行動シミュレーション / 確率的パス探索 / 模倣学習 / 逆最適制御 / 高速パス探索 / 最大エントロピー学習 / パス探索 / 重点サンプリング / 運転行動予測
研究開始時の研究の概要	交通事故撲滅に向け先進運転支援システムの技術開発が近年盛んに行われている．一方，生活道路中の死亡交通事故件数の減少率は緩慢であり，更なる知的支援技術の基盤として，熟練ドライバの運転特性を模倣するモデリング手法（行動予測・シミュレーション行動生成）に期待が高まっている．本研究では，逆強化学習を基盤に，既存技術に比べ高い安定性・安全性を指向する方法論の確立を目指す．具体的には1）大域的最適性を追求する探索ベースの予測技術（安定性），2）熟練者の教示（正例）に加えて負例を導入したモデリング（安全性）を構築し，構築した枠組の評価を行う．
研究成果の概要	近年，先進運転支援システムの開発が盛んである．本研究ではこれらのシステムの高度化を念頭に，逆強化学習（模倣学習・逆最適制御）に基づく運転行動をモデリング（運転行動予測とシミュレーション生成）する手法を開発した．特に，自動車運転行動モデリングの応用の観点にたち，従来の技法で不足していた安定性と安全性を指向する技術を構築した．具体的には，確率的経路生成手法と経路候補に基づく重点サンプリングによる効率的な報酬場推定手法と，負例（交通事故に該当するデータ）を用いた効率的な学習法を開発した．また，負例に該当するデータを安全に収集するため，運転行動データ収集環境を構築し，実際に運転データ収集を行った．
研究成果の学術的意義や社会的意義	本研究で構築した技術の一つである，RRTに基づく経路生成法，及び，重点サンプリング法に基づく報酬場最適化手法は，逆強化学習に基づく運転行動モデリングの適用範囲を拡張するものである，また，負の事案を用いた手法は，熟練ドライバの運転行動の表層的な模倣だけでなく，安全性という価値感を含めた模倣を目指す基盤となっている．構築した技術は交通事故を低減する新たな運転支援システムの開発に貢献する．例えば，事故要因分析や事故回避のシミュレーションへの応用が期待できる．

報告書

(4件)

研究成果
(8件)

すべて 2024 2023 2022 2021

すべて雑誌論文 (1件) 学会発表 (7件) (うち国際学会 3件)

[雑誌論文] 逆強化学習を用いた生活道路中の運転行動モデリング2021
- 著者名/発表者名
  下坂正倫
- 雑誌名
  
  日本ロボット学会誌
  
  巻: 39 号: 7 ページ: 631-636
- DOI
  10.7210/jrsj.39.631
- NAID
  130008083621
- ISSN
  0289-1824, 1884-7145
- 関連する報告書
  2021 実績報告書
[学会発表] Inverse Reinforcement Learning with Failed Demonstrations towards Stable Driving Behavior Modeling2024
- 著者名/発表者名
  Minglu Zhao, Masamichi Shimosaka
- 学会等名
  2024 IEEE Intelligent Vehicle Symposium (IV)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] 危険行動の時間的局所性に着目した負例導入逆強化学習の安定化2023
- 著者名/発表者名
  趙茗王路, 羊少宇, 下坂正倫
- 学会等名
  ロボティクス・メカトロニクス講演会2023
- 関連する報告書
  2023 実績報告書
[学会発表] Improved Template-Based RRT for Efficient Kinodynamic Motion Planning2023
- 著者名/発表者名
  Shaoyu Yang, Minglu Zhao, and Masamichi Shimosaka
- 学会等名
  ロボティクス・メカトロニクス講演会2023
- 関連する報告書
  2023 実績報告書
[学会発表] Sequential 2D Continuous Kinodynamic RRT for Driving Behavior at Un-signalized Intersections with Stop Lines2022
- 著者名/発表者名
  Shaoyu Yang and Masamichi Shimosaka.
- 学会等名
  日本ロボット学会
- 関連する報告書
  2022 実績報告書
[学会発表] RRT-based maximum entropy inverse reinforcement learning for robust and efficient driving behavior prediction2022
- 著者名/発表者名
  Shinpei Hosoma, Masato Sugasaki, Hiroaki Arie, and Masamichi Shimosaka
- 学会等名
  2022 IEEE Intelligent Vehicles Symposium (IV)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] Smooth and Stopping Interval Aware Driving Behavior Prediction at Un-signalized Intersection with Inverse Reinforcement Learning on Sequential MDPs.2021
- 著者名/発表者名
  Shaoyu Yang, Hiroshi Yoshitake, Motoki Shino, and Masamichi Shimosaka.
- 学会等名
  2021 IEEE Intelligent Vehicles Symposium (IV)
- 関連する報告書
  2021 実績報告書
- 国際学会
[学会発表] 特徴量探索とパラメータ最適化の交互実行によるコンパクトな運転行動推定モデル2021
- 著者名/発表者名
  平川優伎, 下坂正倫
- 学会等名
  第22回計測自動制御学会システムインテグレーション部門講演会
- 関連する報告書
  2021 実績報告書

安定・安全を指向する逆強化学習に基づく運転行動モデリング

研究代表者

下坂 正倫 東京工業大学, 情報理工学院, 准教授 (40431796)

17,030千円 (直接経費: 13,100千円、間接経費: 3,930千円)

報告書

研究成果

[雑誌論文] 逆強化学習を用いた生活道路中の運転行動モデリング2021

著者名/発表者名

雑誌名

DOI

NAID

ISSN

関連する報告書

[学会発表] Inverse Reinforcement Learning with Failed Demonstrations towards Stable Driving Behavior Modeling2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 危険行動の時間的局所性に着目した負例導入逆強化学習の安定化2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Improved Template-Based RRT for Efficient Kinodynamic Motion Planning2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Sequential 2D Continuous Kinodynamic RRT for Driving Behavior at Un-signalized Intersections with Stop Lines2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] RRT-based maximum entropy inverse reinforcement learning for robust and efficient driving behavior prediction2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Smooth and Stopping Interval Aware Driving Behavior Prediction at Un-signalized Intersection with Inverse Reinforcement Learning on Sequential MDPs.2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 特徴量探索とパラメータ最適化の交互実行によるコンパクトな運転行動推定モデル2021

著者名/発表者名

学会等名

関連する報告書

下坂正倫東京工業大学, 情報理工学院, 准教授 (40431796)