研究課題/領域番号 |
20K04965
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分25010:社会システム工学関連
|
研究機関 | 富山県立大学 |
研究代表者 |
榊原 一紀 富山県立大学, 工学部, 教授 (30388110)
|
研究分担者 |
大倉 裕貴 富山県立大学, 工学部, 講師 (20842777)
渡邉 真也 室蘭工業大学, 大学院工学研究科, 教授 (30388136)
|
研究期間 (年度) |
2020-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2024年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2023年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2021年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | モデル予測制御 / 機械学習 / マルチエージェント / 群制御 / ランダムフォレスト / ゲーム理論 / マルチ・エージェント / 自動運転 / 自動運転車 / 数理計画 / メタヒューリスティクス / 最適化 |
研究開始時の研究の概要 |
多数の自動運転車が相互に通信しながら,地域の人の移動を支える旅客輸送システムの実現を目指し,コミュニティ全体の安全性および利便性を両立させるような群制御の基盤技術の確立する.そのために,(A) 交通システム全体を数理計画モデルとして記述することにより,全体最適な車両の運用則を得る. (B) 得られた運用則を教師とする機械学習器を開発し,他車両の動きを前提とした車両毎の運用則を実現する.(C) 獲得された運用則を車両エージェントに埋め込んだエージェント・シミュレーションを実行することにより,現実状況を反映した精緻な全体評価とその評価の基づく運用則のリファインを教師なし学習の枠組みで実現する.
|
研究実績の概要 |
本研究の目的は,自動運転車群が配備された大規模・高密度なスマートシティを対象とした自律制御と集中管理群制御が連携した安全かつ高効率な自動運転車群制御手法の確立となる.そのため本研究課題では具体的に次の3つの段階に分けて進めていく: (A)都市空間内における自動運転車の群制御を表現する数理計画モデルの開発 (B)(A)で得られた最適解を教師とする機械学習器の開発 (C)(B)で得られた学習結果を現実的かつ精緻に評価し,リファインするためのマルチエージェント・シミュレーション技法および教師なし学習技法の開発 この中でも2023年度は主に,(B)および(C)に焦点を当てて研究を進めた.数百台規模の車両の動きをシミュレーションするために,車両1台1台のダイナミクスを表現可能な大規模都市交通シミュレータSUMOを採用した.SUMOは交差点上での車両の軌跡・位置関係を精緻に表現できるなど,シミュレーション精度は高い.SUMO上の車両エージェントに機械学習の結果を反映するために,前述の最適化指向のマルチエージェント・シミュレーション技法を組み込んだ.マルチエージェント・シミュレーションによる評価(ODに対する待ち時間や旅行時間)を報酬とする状態-行動価値関数を,(B)の機械学習結果から構築し,モデル予測制御の枠組みで経路計画法を構築した.さらに,この経路計画法の結果を教師として,機械学習器を実装した.機械学習としては,メッシュ化された対象地域に交通集中状況を表すヒートマップを作成し,ヒートマップに対して畳み込み型ニューラルネットワークを構成した.さらに地図データとしては,前年度までマンハッタン型の格子型道路網を対象としていたが,2023年度は一般型の地図網を扱えるようにプログラムをアップデートした.地図データとしてはOpenStreetMapから富山市内の道路ネットワークを取得した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
リアルタイムでの経路計画が最適性の高いものになっていることが確認されたため.また一般的な道路ネットワークが扱えるようになったため.
|
今後の研究の推進方策 |
最終年度においては,前年度に開発したSUMO上の車両エージェントに機械学習の結果を反映するために,最適化指向のマルチエージェント・シミュレーション技法を組み込む.マルチエージェント・シ ミュレーションによる評価(ODに対する待ち時間や旅行時間)を報酬とする状態-行動価値関数を,機械学習結果から構築し,強化学習を実現する.この学習モデルを富山市内の一般的な道路ネットワークに対して評価実験を行い.有効性を確認する.
|