Research Project
Grant-in-Aid for JSPS Fellows
現実での意思決定には,意思決定に必要な情報の一部のみ観測可能であるという部分観測性が伴います.本研究課題では,現実に我々が直面する部分観測性を適切にモデル化し,モデルの仮定を活用し高い性能を達成する強化学習アルゴリズムの開発,およびその理論的な性能保証を目指します.