Research Project
Grant-in-Aid for Scientific Research (B)
近年、深層強化学習技術の急速な発展により、囲碁や将棋、ビデオゲームなどで人間を越えるレベルのAI が実現されているが、ロボットやプラント、交通やインフラの制御といった現実世界の意志決定問題に対する深層強化学習の応用は限定的である。現実のタスクの多くは、完了までに多くのステップを必要とする長期タスクであり、本研究プロジェクトでは、そのような問題に対して有効な階層強化学習手法の確立を目指す。具体的には、多様で有効なスキルを自動的に獲得し、さらにそれらを再利用可能にすることなどを通してエージェントの学習効率および汎化能力の向上を目指す。