Research Project
Grant-in-Aid for Scientific Research (B)
集団を構成するエージェントのパフォーマンスが集団全体および個々のエージェントの両者にとって最適なものとなるように、各エージェントが互いの相互作用の仕方を深層強化学習という最新の技術を使って学習する。その一つの応用例として船舶などの自律移動体による自動衝突回避の問題を取り上げ、当初は「ぎこちなく」交差していた移動体が学習過程を経て「賢く」交差できるようになることを実験等で示す。また、ここでの基本的なアイデアがより広い文脈に適用できることを示す。