研究課題
基盤研究(C)
通信,制御技術の発展に伴い,システムは大規模化,複雑化の一途を辿っている.強化学習は,エージェントと環境との相互作用を反復的に行い,報酬を最大化する方策の決定を行う,逐次的意思決定問題に焦点を当てた技術であるが,エージェントが複数になるなど問題が複雑になると,求解のために必要な反復回数が膨大になり,求解に時間を要することが知られている.本研究課題では,システムの大規模化,複雑化に向け,生物の群れに見られるフロッキングの仕組みが高い拡張性を有することに着目し,強化学習と組み合わせることにより,複数のエージェントが環境と相互作用を行う複雑な問題に対して,高い拡張性を有する学習の仕組みを確立する.