全体最適と個人最適を両立させる分散協調問題解決

Research Project

Project/Area Number	22H03647
Research Category	Grant-in-Aid for Scientific Research (B)
Allocation Type	Single-year Grants
Section	一般
Review Section	Basic Section 61030:Intelligent informatics-related
Research Institution	Kobe University
Principal Investigator	平山勝敏神戸大学, 海事科学研究科, 教授 (00273813)
Co-Investigator(Kenkyū-buntansha)	沖本天太神戸大学, 海事科学研究科, 准教授 (10632432) 松井俊浩名古屋工業大学, 工学(系)研究科(研究院), 准教授 (60437093)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥16,640,000 (Direct Cost: ¥12,800,000、Indirect Cost: ¥3,840,000) Fiscal Year 2023: ¥4,940,000 (Direct Cost: ¥3,800,000、Indirect Cost: ¥1,140,000) Fiscal Year 2022: ¥8,060,000 (Direct Cost: ¥6,200,000、Indirect Cost: ¥1,860,000)
Keywords	分散最適化アルゴリズム / 深層強化学習 / 分散衝突回避
Outline of Research at the Start	集団を構成するエージェントのパフォーマンスが集団全体および個々のエージェントの両者にとって最適なものとなるように、各エージェントが互いの相互作用の仕方を深層強化学習という最新の技術を使って学習する。その一つの応用例として船舶などの自律移動体による自動衝突回避の問題を取り上げ、当初は「ぎこちなく」交差していた移動体が学習過程を経て「賢く」交差できるようになることを実験等で示す。また、ここでの基本的なアイデアがより広い文脈に適用できることを示す。