研究課題/領域番号 |
20K19946
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分62040:エンタテインメントおよびゲーム情報学関連
|
研究機関 | 北陸先端科学技術大学院大学 |
研究代表者 |
HSUEH ChuHsuan 北陸先端科学技術大学院大学, 先端科学技術研究科, 助教 (30847497)
|
研究期間 (年度) |
2020-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
|
キーワード | AlphaZero / ゲームの解析 / 最適戦略 / 理論値 / Tabular / ニューラルネットワーク / 完全情報ゲーム / 確率的なゲーム / Chinese dark chess / EinStein wurfelt nicht! / NoGo / 強化学習 |
研究開始時の研究の概要 |
AlphaZero はゲームルールのみを知識として用い,ゼロからプロ棋士を上回る強さを持つことができる.しかし,最適戦略や理論値を学習できるのかどうかについては十分調べられていない.さらに,不確定要素を含むゲームへの適用も殆どない.本研究の目的は,AlpahZero 枠組みを用いて,完全情報ゲーム(決定的・確率的)の理論値と最適戦略を学習できるアルゴリズムにすることである.まずは規模が小さくて完全解析が可能なゲームを対象として研究を行い,それから完全解析が困難なゲームへの適用と分析を予定する.さまざまなゲームごとの特性と特徴抽出モデルが学習に与える影響を明らかにし,改善することを目的とする.
|
研究成果の概要 |
AlphaZero はゲームのルールのみを知識として用い,自己対戦によってゼロからプロ棋士を上回る強さを持つことができる.しかし,最適戦略や理論値を学習できるのかどうかについては十分調べられていない.さらに,不確定要素を含むゲームへの適用も殆どない. 本研究ではまず,各局面の最適戦略と理論値がわかることができるような規模の小さいゲームを対象とした.AlphaZero の学習は,いろんな設定では最適戦略や理論値に収束できたことを示した.そして,規模がより大きい・不確定要素を含むゲームへ適用した AlphaZero が大会準優勝レベルの強さを持つことも確認した.
|
研究成果の学術的意義や社会的意義 |
AlphaZero のパラメータを丁寧に調べ,学習結果への影響を明らかにしたことは学術的意義があった.AlphaZero を適用する研究者には,パラメータに関する試行錯誤のコストが減ることを期待する.また,サイコロを振るような不確定要素を含むゲームにおいても,AlphaZero の適用に成功したことの示しに貢献した. さらに,AlphaZero で学習した戦略と局面評価の質がいいことを示したことで,それらの戦略や局面評価の参考価値をより深めた.人間プレイヤ(特に強いプレイヤ)の上達に利用できることを考える.利用価値を深めたことは学術的意義にも社会的意義にも貢献したと考える.
|