Research Project
Grant-in-Aid for Challenging Research (Exploratory)
試行錯誤を通して学習を行うAIに通常用いられているのが強化学習と呼ばれるアルゴリズムである.強化学習は,自律的な学習を実現するアプローチとして期待される一方で,行動の良しあしを定量化する報酬関数を適切に設計しないと適切に機能しない.一方で人間は,内的な好奇心をもって自律的に行動することで,様々な知識を獲得し効率よくスキルを学ぶことができる.本研究では,人間に見られるような自律的な探索とスキルの蓄積を実現することを目指し,自律的な探索を実現する内的報酬を構築し,経験を蓄積するメタモデルを学習するアルゴリズムを開発する.