Empirical Comparison of Evaluation Functions and Search Algorithms and Their Combination to Cover Their Weakness
Project/Area Number |
23K11383
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 62040:Entertainment and game informatics-related
|
Research Institution | Kochi University of Technology |
Principal Investigator |
松崎 公紀 高知工科大学, 情報学群, 教授 (30401243)
|
Project Period (FY) |
2023-04-01 – 2026-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
Fiscal Year 2024: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2023: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
|
Keywords | ゲーム情報学 / パターン表現 / ニューラルネットワーク / αβ探索 / モンテカルロ木探索 / AlphaZero / 評価関数 / 探索アルゴリズム |
Outline of Research at the Start |
研究代表者は,複数のゲーム(「2048」「対戦型2048」「ガイスター」など)に対して複数の手法(Nタプル評価関数,ニューラルネットワーク評価関数,Minimax探索,モンテカルロ木探索など)によるコンピュータプレイヤを実現してきた.本研究では,それらの成果物をもとに,複数のプレイヤ間で実験的に比較することで,評価関数や探索アルゴリズムの得意・不得意を見出す.さらに,それらが不得意とする部分をカバーするように組み合わせる方法を提案し,全体としてのプレイヤの性能向上を目指す.
|
Outline of Annual Research Achievements |
評価関数と探索アルゴリズムは,ゲームAIを構成する重要な技術である.現在,評価関数については古典的なパターン表現によるものとニューラルネットワークによるもの,探索アルゴリズムについてはαβ探索とモンテカルロ木探索が有力な手法である.本研究は,それら評価関数と探索アルゴリズムを,主に確率的ゲームや不完全情報ゲームを題材にして実験により比較することで,それらの有利・不利および特性について知見を深めようとするものである. 2023年度には,(1) 確率的ゲーム「ミニ2048」の完全解析とそれを用いた評価関数とその学習手法の解析,(2) 多人数不完全情報ゲーム「DouDizhu」の深層強化学習によるAIエージェント作成,について進展があった. (1) まず,確率的ゲーム「ミニ2048」の完全解析について追試を行い同一の結果を確認した.その上で,完全解析されたゲームの局面データベースを用いて,「2048」における最有力手法である,Nタプルネットワークの性質について分析を行った.本項目の研究成果は,国際会議 TAAI 2023,IEEE CoG 2024,国内会議1件で発表した(する予定である). (2) 多人数不完全情報ゲーム「DouDizhu」に対し,とくにそのbiddingフェーズを適切にプレイするAIエージェントを深層強化学習により開発した.この成果は,国際会議 IEEE CoG 2023 にて発表した.今後,比較となるパターン表現によるプレイヤー開発や,探索手法との組合せ方について研究を進める予定である.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
確率的ゲーム「ミニ2048」に対する完全解析が完了し,盤面情報データベースが研究に利用できる形で得られた.この成果をもとに,評価関数や探索アルゴリズムを比較することができる状況にある.
|
Strategy for Future Research Activity |
2024年度には,次の3つの観点で研究を進めていく予定である:(1) 確率的ゲーム「ミニ2048」を用いた評価関数と探索アルゴリズムの比較 (2) 多人数不完全情報ゲーム「DouDizhu」のさらなるAIエージェントの開発 (3) 将来の研究に用いる完全解析されたゲームデータの蓄積 (1) 2023年度に達成した確率的ゲーム「ミニ2048」の完全解析の結果を用いて,評価関数と探索アルゴリズムの比較について研究を進める.すでに,ゲーム「2048」に対する評価関数の設計法や探索アルゴリズムについては複数の論文があり,それらの手法を「ミニ2048」上で実装することで評価を進めていく. (2) 多人数不完全情報ゲーム「DouDizhu」に対し,biddingフェーズとcardplayフェーズの両方に対応できるAIエージェントを開発する.さらに,現在はニューラルネットワークベースで実装を行っているため,古典的手法での実装も行い比較を行う予定である. (3) 「ミニ2048」を用いた研究より,完全解析されたゲームデータを持つことが,本研究を進めるにあたって重要であることが分かった.そこで,そのような完全解析可能なゲームをさらにいくつかデザインして,実際に完全解析データベースとして整備することを計画している.
|
Report
(1 results)
Research Products
(6 results)