Research Project
Grant-in-Aid for Challenging Research (Exploratory)
本研究では,機械学習と情報理論の観点から,不完全情報下における逐次的意思決定の分析手法を開拓することを目的とする.具体的には,私的観測というお互いの行動を正確に観測できない状況におけるゲームの帰結 (均衡) を求める問題を扱う.これは部分観測可能マルコフ決定過程 (POMDP) に帰着できることが知られているが,一般には決定不能な問題であり,解析的な分析が可能な定式化や解法は未だ見つかっていない長年の学際的かつ挑戦的な課題である.本応募では機械学習理論および情報理論の観点から,POMDPを俯瞰し,大規模な問題に適用可能な,精度保証つきの近似解法を構築する.