研究成果の学術的意義や社会的意義 |
AlphaGo手法 (後継であるAlphaGo Zero, AlphaZero, MuZeroを含む) は,チェス・将棋・囲碁のような二人完全情報ゲームにおいて人間を超える強さのプレイヤーを実現した.本研究は,不完全情報ゲームや確率的ゲームといったより困難なゲームに対してAlphaGo手法(または一般に深層強化学習)を適用する上で遭遇しうる問題点をいくつか明らかにした.特に,確率的ゲーム「2048」における深層強化学習において,確率的要素が学習を悪化させることを明らかにし,その対応方法につながる課題の発見に至った.
|