研究課題
若手研究(B)
ゲームAI やロボティクスを初めとした巨大な探索空間において、強化学習で最も重要な課題である「速さと正確さのトレードオフ」の既存の限界を超える手法の開発が行われている。そこで本研究では、その既存の限界を突破するため、既存研究とは別のアイディアとして人間の満足化の概念を探索技法の中心的な役割を果たす木探索(モンテカルロ木探索)へ実装し、新しい探索技法の開発を進めた。また、モンテカルロ木探索において満足化の優れた性能を示した。
人工知能, 知能情報学
本研究は、人間の適応的な意思決定方法を探索能力として活用する。強化学習技術の枠組を用いて、その探索能力を探索技法の中心的な役割を果たす木探索への実装に着目した。本研究は一般性が高いものであると考えており、各既存問題に応用する際に、複雑なアルゴリズム化等が不要であることから、バンディット問題の応用例である様々なゲームAI や、スケジューリング、最適化問題等の幅広い領域での結果の一般性が期待でき、幅広い探索問題への波及効果があると考えている。