• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

DeepMind's large-scale experiment on shogi artificial intelligence and verification of its knowledge acquisition process

Research Project

Project/Area Number 20K12120
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 62040:Entertainment and game informatics-related
Research InstitutionThe University of Electro-Communications

Principal Investigator

Hoki Kunihito  電気通信大学, 大学院情報理工学研究科, 准教授 (00436081)

Co-Investigator(Kenkyū-buntansha) 伊藤 毅志  電気通信大学, 大学院情報理工学研究科, 教授 (40262373)
Project Period (FY) 2020-04-01 – 2024-03-31
Project Status Completed (Fiscal Year 2023)
Budget Amount *help
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2022: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2021: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2020: ¥1,950,000 (Direct Cost: ¥1,500,000、Indirect Cost: ¥450,000)
KeywordsAlphaZero / 深層学習 / 強化学習 / 将棋 / グラフィカル・プロセッシング・ユニット / ゲーム人工知能 / 人工知能 / ヒューリスティック探索
Outline of Research at the Start

2019年にSilverらは、囲碁・将棋などの知識を自己対局形式により獲得する人工知能プレイヤの強化学習アルゴリズムAlphaZeroとその実験結果をサイエンス誌で発表した。本研究では、この先行研究の将棋における大規模実験の追試を市場に出回っているハードウエアを用いて行い、強化学習過程や生成された人工知能の性能を観測し、AlphaZeroが将棋知識を獲得する過程を分析する。知識獲得過程の分析は、将棋などのボードゲームプレイヤの認知学の専門家 (研究分担者) と協調して行う。

Outline of Final Research Achievements

This research conducted a follow-up test of large-scale deep reinforcement learning for shogi in previous research using hardware on the market, and observed the learning process and the performance of the generated artificial intelligence. In order to conduct follow-up experiments, the presenter pursued the computational efficiency of self-game generation using graphics processing units (GPUs). Using NVIDIA's GPU, which costs about 150,000 yen, we achieved an efficiency of about 10,000 gameplays per day. The shogi player, which was constructed using only commercially available hardware, achieved performance comparable to previous research.
In addition, inspired by the process of organizing the large amount of game records generated in this research, we developed a new method to represent the state space of a board game as a sparse set of combinations.

Academic Significance and Societal Importance of the Research Achievements

将棋人工知能と本研究課題で公開するプログラムを比較することにより、現在の日本における将棋人工知能技術と国際標準となったAlphaZeroの技術とを性能・コスト・プレイスタイルなどの面で比較検討することが可能となる。本研究の成果物であるプログラムコードAobaZeroは、GitHubリポジトリ「AobaZero」(https://github.com/kobanium/aobazero)にて公開している。インターネットの検索エンジンにて、二つのキーワード「将棋」と「AobaZero」で検索すると、これが多数の Web ページで紹介されていることが確認できる。

Report

(5 results)
  • 2023 Annual Research Report   Final Research Report ( PDF )
  • 2022 Research-status Report
  • 2021 Research-status Report
  • 2020 Research-status Report
  • Research Products

    (2 results)

All 2023 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Remarks (1 results)

  • [Journal Article] Strongly Solving NOCCA × NOCCA2023

    • Author(s)
      山本 敦也、保木 邦仁
    • Journal Title

      情報処理学会論文誌

      Volume: 64 Issue: 12 Pages: 1678-1688

    • DOI

      10.20729/00231448

    • ISSN
      1882-7764
    • Year and Date
      2023-12-15
    • Related Report
      2023 Annual Research Report
    • Peer Reviewed
  • [Remarks] GitHub リポジトリ「AobaZero」

    • URL

      https://github.com/kobanium/aobazero

    • Related Report
      2022 Research-status Report

URL: 

Published: 2020-04-28   Modified: 2025-01-30  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi