研究課題
基盤研究(C)
純粋探索問題は、A/Bテストのような最適選択肢を特定する最適腕識別問題を一般化したものであり、所与の誤識別率δに対して、確率1-δ以上で、与えられた判別関数が定める各腕の平均報酬の組に対する「正解」を正しく識別する問題として定式化される。最近では、純粋探索問題に対して漸近最適性を持つ汎用アルゴリズムが提案されるが、一般的な解法が存在しない最適化問題を解決する必要があることや、非効率的な「強制探索」が必要であるという問題点がある。本研究では、これらの最適化問題に対する効率的な解法を提案し、強制探索に依存しない効率的な探索アルゴリズムの開発を行う。