研究課題/領域番号 |
23K26321
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分24020:船舶海洋工学関連
|
研究機関 | 大阪公立大学 |
研究代表者 |
橋本 博公 大阪公立大学, 大学院工学研究科, 教授 (30397731)
|
研究分担者 |
松田 秋彦 国立研究開発法人水産研究・教育機構, 水産技術研究所(神栖), 主幹研究員 (10344334)
若林 伸和 神戸大学, 海事科学研究科, 教授 (60242351)
檜垣 岳史 大阪公立大学, 大学院工学研究科, 助教 (71000014)
|
研究期間 (年度) |
2024-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
10,400千円 (直接経費: 8,000千円、間接経費: 2,400千円)
2025年度: 3,380千円 (直接経費: 2,600千円、間接経費: 780千円)
2024年度: 7,020千円 (直接経費: 5,400千円、間接経費: 1,620千円)
|
キーワード | 模倣学習 / 逆強化学習 / 自律運航船 / 航路プランナー / 実船実験 |
研究開始時の研究の概要 |
深層強化学習による自律航行AIの開発が進められているが,熟練操船者が行っている高度かつ柔軟な判断を再現できる報酬の設計は困難である。本研究は,報酬設計の困難さを解決することを目的とする。はじめに,逆強化学習を用いて,熟練者の操船データから避航操船や離着岸操船における報酬の可視化を図り,深層強化学習ベースの航路プランナーを開発する。次に,敵対的模倣学習を用いることで,報酬を設計することなく,熟練者の操船データから直接的に航路プランナーを開発する。最後に,模型実験や実船実験を実施することで,両プランナーの定量的評価を行う。
|