• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

不完全情報・確率的・多人数ゲームにおけるAlphaGo手法の評価と改良

Research Project

Project/Area Number 20K12124
Research InstitutionKochi University of Technology

Principal Investigator

松崎 公紀  高知工科大学, 情報学群, 教授 (30401243)

Project Period (FY) 2020-04-01 – 2024-03-31
KeywordsAlphaGo / 深層強化学習 / ゲームAI / モンテカルロ木探索
Outline of Annual Research Achievements

本研究は,AlphaGo (およびその後継であるAlphaGo Zero, AlphaZeroを含む) 手法をより広いゲームに適用する際に起こる問題点を明らかにし,それを改良することを目指す研究である.本年度は主に,(1) 確率的一人ゲーム「2048」への強化学習手法「Monte-Carlo Softmax 探索」の適用と評価,(2) 不完全情報ゲーム「Geister」への深層強化学習の適用による不完全性の影響の調査,(3) 多人数不完全情報ゲーム「DouDizhu」への深層強化学習の適用の3点について研究を進めた.
(1) AlphaGo 手法は,方策(ポリシー)と値(バリュー)の2つを同時に学習する深層強化学習手法である.それに対し,値(バリュー)のみを学習する Monte-Carlo Softmax Search アルゴリズムを2048に適用する上での課題を明らかにした.具体的には,値の過大評価を抑えるDouble Q-Learningの手法を応用するアルゴリズムの適用と評価を行い,その成果を国内研究会で発表した.
(2) 前年度に引き続き,不完全情報ゲーム「Geister」への深層強化学習の適用することでAIエージェント開発し,得られたAIエージェントを用いることでゲームそのものの性質を解明するという課題に挑戦した.「Geister」のいくつかの変種に対して本手法を適用して評価した.この成果は国際論文誌に掲載された.
(3) 多人数不完全情報ゲーム「DouDizhu」の,とくにそのbiddingフェーズについて,深層強化学習を適用して優れたAIエージェントを作成した.この成果を,国際会議にて発表した.

  • Research Products

    (6 results)

All 2024 2023

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (5 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] Evaluating the Influence of Imperfect Information in Geister Using DREAM Trained Agents2024

    • Author(s)
      Troillet Lucien、Matsuzaki Kiminori
    • Journal Title

      IEEE Transactions on Games

      Volume: - Pages: 1~15

    • DOI

      10.1109/TG.2023.3324737

    • Peer Reviewed
  • [Presentation] ミニ2048の完全解析を用いたNタプルネットワーク+Expectimax探索プレイヤの分析2024

    • Author(s)
      寺内 俊輔, 松崎 公紀
    • Organizer
      第65回プログラミング・シンポジウム
  • [Presentation] モンテカルロ木探索の結果からの学習による2048プレイヤの開発2024

    • Author(s)
      渡邊 翔太, 松崎 公紀
    • Organizer
      情報処理学会第51回ゲーム情報学研究会
  • [Presentation] Using Strongly Solved Mini2048 to Analyze Players with N-tuple Networks2023

    • Author(s)
      Shunsuke Terauchi, Takaharu.Kubota, and Kiminori Matsuzaki
    • Organizer
      The 28th International Conference on Technologies and Applications of Artificial Intelligence (TAAI 2023)
    • Int'l Joint Research
  • [Presentation] Complete DouDizhu Agents: Bid Learning from Pretrained Cardplay2023

    • Author(s)
      Chuanfa Li, Lucien Troillet, and Kiminori Matsuzaki
    • Organizer
      2023 IEEE Conference on Games (CoG)
    • Int'l Joint Research
  • [Presentation] AlphaDDA の局面評価値を用いた再評価2023

    • Author(s)
      久保田 留奈, 松崎 公紀
    • Organizer
      令和5年度 電気・電子・情報関係学会四国支部連合大会

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi