安全性と効率性を勘案した航路を事前に選定することの重要性から,多船航路探索用マルチエージェント強化学習システム(MARLS)を研究してきたが,問題の大規模化等により学習効率が低下する.本研究は,エージェントの行動を舵角という原始的な表現から,回避,針路回復,進路維持という高度な表現とすることで学習効率の向上を図り,高次の要求(回避開始点の明確化)を満足する航路探索を目指すものである. 最終年度以前の研究では,2019-2020年度に『高度な行動表現に対応する目標航路を行動とする多船航路探索用MARLS(TC-MARLS)』を構築し,2021年度に『衝突誘発に基づいて回避開始点を明確化するTC-MARLS(提案手法1)』を提案し,さらに2022年度に『安全性を保障しつつ回避開始点を明確化するTC-MARLS(提案手法2)』を提案した.しかし提案手法2では,安全性を調整するための基準値(安全マージン)を固定値とする必要があり,経験的に決めていた.そこで最終年度は提案手法2の拡張版として『変動安全マージンを導入したTC-MARLS(提案手法3)』を提案した. 計算機実験の結果,本研究における全ての提案手法は『舵角を行動とする多船航路探索用MARLS』よりも航路効率および学習効率の点で優れていることが確認された.さらに3つの提案手法を比較したところ,学習効率の観点では提案手法3が最も優れており,航路効率性の観点では提案手法1が他の提案手法よりも僅かに優れていたが殆ど差異は無かった.また,回避開始点の明確化については, 提案手法3によって得られる回避開始点が最もばらつきが少ないことが確認された. 以上より,目標航路を行動とするTC-MARLSによって学習効率の向上を達成し,さらに高次の要求の1つである回避開始点の明確化を実現するための基本システムが完成したといえる.
|