研究概要 |
本研究は知能情報学と船舶工学間の技術交流を図る試みであり,『複数船舶が競合する海域での航路を決定するために,"航法(他船衝突予防のための国際規則)を組み込んだマルチエージェント強化学習システム"を実装し,実用的な船舶航路評価ツールの基礎を構築する』ことを目的とする. 研究計画に従って,『2隻の船舶を対象とした船舶航路決定タスクについて航法を導入したマルチエージェント強化学習システム』を実現し,『複数船舶(10隻程度)を対象とした船舶航路決定タスクについて航法を導入したマルチエージェント強化学習システム』への拡張を行った.計算機実験の結果,航法の導入方法として衝突状況に応じた動的な衝突判定領域を設定するだけでは,妥当な航路の獲得および学習効率の点において深刻な性能不足が発生することが明らかとなった.そして,『動的な衝突判定領域の設定が受動的な航法の導入にすぎない』ために性能不足という問題が発生したという結論に達した. この問題を解決するために,航法に基づく衝突状況判定結果に従って船舶が取り得る行動を制限する方法を追加した.つまり,動的な衝突判定領域の設定が受動的な航法の導入であるのに対し,衝突状況判定結果に基づく行動選択制限は能動的な航法の導入であるといえる.行動選択制限によりシステムが学習すべき状態行動空間が削減されるため,必然的に学習効率の改善が期待できる.さらに,行動選択制限を適切に行うことにより航路獲得の見通しが良くなるため,航路獲得率の改善が期待できる.計算機実験の結果,航路獲得率および学習効率の両方で大幅な性能改善が確認され,航法を適切かつ能動的にシステムに取り入れることが実用的な船舶航路評価ツールの構築に不可欠であるという重要な知見が得られた.今後の課題としては,行動選択制限方法の改良および行動選択制限の強度に対するシステム性能の評価などが挙げられる.
|