• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

将棋人工知能に関するディープマインド社の大規模実験とその知識獲得過程の検証

研究課題

研究課題/領域番号 20K12120
研究機関電気通信大学

研究代表者

保木 邦仁  電気通信大学, 大学院情報理工学研究科, 准教授 (00436081)

研究分担者 伊藤 毅志  電気通信大学, 大学院情報理工学研究科, 教授 (40262373)
研究期間 (年度) 2020-04-01 – 2024-03-31
キーワードゲーム人工知能 / 深層学習 / 強化学習
研究実績の概要

Silver らは 2019 年、囲碁・将棋などの知識を自己対局形式により獲得する人工知能プレイヤの強化学習アルゴリズム AlphaZero とその実験結果をサイエンス誌で発表した。本研究では、この先行研究の将棋における大規模実験の追試を市場に出回っているハードウエアを用いて行い、強化学習過程や生成された人工知能の性能を観測した。報告者は追実験を行うため、グラフィックス・プロセッシング・ユニット (GPU) を活用した自己対局生成の計算効率を追求した。NVIDIA 社の1個15万円程度の GPU (GeForce RTX 2080) を用いて、日産1万局程度の効率を達成した。そして、市販ハードウエアのみを用いて構築された追実装は、AlphaZero の将棋の実験に準じた性能を獲得した (山下宏、保木邦仁、小林祐樹、AobaZero の高速化と現在の状況、コンピュータ将棋協会誌、vol. 32, pp. 72-86, 2021)。
本研究の成果物であるプログラムコードは、GitHub リポジトリ「AobaZero」(https://github.com/kobanium/aobazero) にて公開している。インターネットの検索エンジンにて、二つのキーワード「将棋」と「AobaZero」で検索すると、これが多数の Web ページで紹介されていることが確認できる。
また、本研究において生成された大量の棋譜を整理する過程から着想を得て、ボードゲームの状態空間を疎な組合せ集合として表現する方法を新規開発するに至った (山本敦也, 保木邦仁、NOCCA × NOCCAの強解決、情報処理学会論文誌、64, 1678-1688, 2023)。

  • 研究成果

    (1件)

すべて 2023

すべて 雑誌論文 (1件) (うち査読あり 1件)

  • [雑誌論文] NOCCA × NOCCAの強解決2023

    • 著者名/発表者名
      山本 敦也、保木 邦仁
    • 雑誌名

      情報処理学会論文誌

      巻: 64 ページ: 1678~1688

    • DOI

      10.20729/00231448

    • 査読あり

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi