研究課題/領域番号 |
21H03517
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 東京工業大学 |
研究代表者 |
下坂 正倫 東京工業大学, 情報理工学院, 准教授 (40431796)
|
研究分担者 |
小竹 元基 東京工業大学, 工学院, 教授 (10345085)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,030千円 (直接経費: 13,100千円、間接経費: 3,930千円)
2023年度: 4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2022年度: 6,760千円 (直接経費: 5,200千円、間接経費: 1,560千円)
2021年度: 5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
|
キーワード | 逆強化学習 / 運転行動モデリング / 経路生成 / RRT / 運転行動シミュレーション / 確率的パス探索 / 模倣学習 / 逆最適制御 / 高速パス探索 / 最大エントロピー学習 / パス探索 / 重点サンプリング / 運転行動予測 |
研究開始時の研究の概要 |
交通事故撲滅に向け先進運転支援システムの技術開発が近年盛んに行われている.一方,生活道路中の死亡交通事故件数の減少率は緩慢であり,更なる知的支援技術の基盤として,熟練ドライバの運転特性を模倣するモデリング手法(行動予測・シミュレーション行動生成)に期待が高まっている.本研究では,逆強化学習を基盤に,既存技術に比べ高い安定性・安全性を指向する方法論の確立を目指す.具体的には1)大域的最適性を追求する探索ベースの予測技術(安定性),2)熟練者の教示(正例)に加えて負例を導入したモデリング(安全性)を構築し,構築した枠組の評価を行う.
|
研究成果の概要 |
近年,先進運転支援システムの開発が盛んである.本研究ではこれらのシステムの高度化を念頭に,逆強化学習(模倣学習・逆最適制御)に基づく運転行動をモデリング(運転行動予測とシミュレーション生成)する手法を開発した.特に,自動車運転行動モデリングの応用の観点にたち,従来の技法で不足していた安定性と安全性を指向する技術を構築した.具体的には,確率的経路生成手法と経路候補に基づく重点サンプリングによる効率的な報酬場推定手法と,負例(交通事故に該当するデータ)を用いた効率的な学習法を開発した.また,負例に該当するデータを安全に収集するため,運転行動データ収集環境を構築し,実際に運転データ収集を行った.
|
研究成果の学術的意義や社会的意義 |
本研究で構築した技術の一つである,RRTに基づく経路生成法,及び,重点サンプリング法に基づく報酬場最適化手法は,逆強化学習に基づく運転行動モデリングの適用範囲を拡張するものである,また,負の事案を用いた手法は,熟練ドライバの運転行動の表層的な模倣だけでなく,安全性という価値感を含めた模倣を目指す基盤となっている.構築した技術は交通事故を低減する新たな運転支援システムの開発に貢献する.例えば,事故要因分析や事故回避のシミュレーションへの応用が期待できる.
|