• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

人間を超える汎用的不完全情報ゲームAIの開発

研究課題

研究課題/領域番号 22K12339
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分62040:エンタテインメントおよびゲーム情報学関連
研究機関松江工業高等専門学校

研究代表者

橋本 剛  松江工業高等専門学校, 情報工学科, 教授 (40420335)

研究分担者 HSUEH ChuHsuan  北陸先端科学技術大学院大学, 先端科学技術研究科, 助教 (30847497)
研究期間 (年度) 2022-04-01 – 2027-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2026年度: 390千円 (直接経費: 300千円、間接経費: 90千円)
2025年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
キーワード不完全情報ゲーム / ガイスター / Transformer / TGEM / ドミニオン / LDM / Gumbel MuZero / EinStein Wurfelt Nicht! / UCT / AlphaZero / Chinese dark chess / Computer Olympiad / ポケモン / 格闘ゲーム / 汎用的AI / BERT / 方策勾配法
研究開始時の研究の概要

将棋や囲碁など、二人完全情報ゲームの研究は盛んに行われたが、不完全情報ゲームの研究はまだ多くなく、ゲームAI研究のターゲットとして注目されている。本研究は、不完全情報ゲームで人間を超えるAIが作れる汎用的なシステムの作成を目標とする。AIは強化学習と探索を軸に開発する。不完全情報ゲームでは相手のくせを見抜くことが本質的に重要と考え、履歴をキーワードにした手法開発を目指し、自然言語処理の手法を参考に開発する。主な題材とするガイスターで人間を超えるAIが作成できたら他の不完全情報ゲームで汎用性を確認し、最終的にはAlphaZeroのような汎用性の高いシステムを作り広く公開したい。

研究実績の概要

不完全情報ゲーム研究の題材として、今年度もガイスターを中心に開発を行い、自然言語を使って相手の「くせ」を考慮するAIの開発方法を検討した。まずは自然言語処理モデル Transformerを用いる手法を開発した。ガイスターは相手駒の種類が分からない不完全情報ゲームなので、Transformerを相手駒種推定に使うことにした。開発した TGEM は自駒の種類と行動履歴を一文として入力し、相手駒種を推定するモデルである。実験では、ランダムに相手駒種を推定する場合に比べて高い精度を出すことができた。
また、複雑な不完全情報ゲームであるドミニオンを題材とした深層強化学習の研究にも取り組んだ。ドミニオンはゲームごとに異なる種類のカードを組み合わせるルールのためすべてを事前に学習することが難しい。そこで、未知の場を学習する際に既存の学習した場の中から類似性の高い場の学習モデルを用いることで学習時間を大幅に短縮させる手法を試した。強化学習では少しの違いを理解させ効率的に学習を続けるのが難しいが、変更するカードは効果のみを変更することにより学習モデルにあたかもこれまでと同じ場を学習しているかのように錯覚させる Learning by Deceive Method(LDM)を提案した。LDM を用いた実験により大幅な学習時間短縮が確認できた。
1人用確率ゲーム2048にGumbel MuZeroという手法を適用し、木探索のシミュレーション回数が少ない方が学習の結果がいいという直感に反する報告がある。我々はこの手法をEinStein Wurfelt Nicht!(EWN)という2人ゲームに適用し、現象が発生することを確認した。更に確率要素を除いたEWNにも適用し、現象の発生する原因は確率要素に関わることを示唆した。また、上海ゲームという1人用不完全情報ゲームにおいて、人間の記憶モデルを調べた。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究の核として考えていた、自然言語処理技術を用いて不完全情報ゲームのくせを考慮するAI開発が順調に進んでいる。題材の中心としてガイスターという不完全情報ゲームを使うことを想定していたが、実際にTransformerという手法を用いて強化学習に応用する手法を提案、実装することができた。実験により実用化の目処も立ち、実際にAIの大会に参加もできている。更にブラッシュアップする必要があるが、この核の部分は想定通りの順調な進み具合であると判断できる。
ガイスター以外を題材とした不完全情報ゲームの研究も進めるつもりであったが、今回ドミニオンという複雑な不完全情報ゲームを題材として、強化学習を実用可能なレベルで実行するための基礎研究を行い、LDMという新たな手法を提案し、実験によりその効果を確認することができた。
また、強化学習以外に不完全情報ゲームの木探索手法を開発することも重要なテーマとして考えていたが、今回EWNというゲームを題材にモンテカルロ木探索の性能について分析を行うことができた。
以上より、全体的に当初の計画通り概ね順調であると判断した。

今後の研究の推進方策

当初の計画通り、引き続きガイスターを題材に自然言語処理技術を用いて不完全情報ゲームのくせを考慮するAI開発を進めていく。現在はゲームAI強化学習のフレームワークとして有名なHandyRLを用いて、これに自然言語処理手法を応用できるよう改良して新たなAI開発を進めている。
不完全情報ゲームの木探索手法開発については、これまでにガイスターを題材にいくつか研究を進めて発表をしたが、他のもう少し複雑な不完全情報ゲームへの適用を視野にして、いくつかの新たな題材で開発を進めていく。今回用いたEWNを引き続き題材として開発するほか、他の題材を使った開発も検討していく。

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (14件)

すべて 2023 2022

すべて 雑誌論文 (2件) (うち国際共著 2件、 査読あり 1件、 オープンアクセス 1件) 学会発表 (11件) (うち国際学会 1件) 図書 (1件)

  • [雑誌論文] Analyses of Tabular AlphaZero on Strongly-Solved Stochastic Games2023

    • 著者名/発表者名
      Hsueh Chu-Hsuan、Ikeda Kokolo、Wu I-Chen、Chen Jr-Chang、Hsu Tsan-Sheng
    • 雑誌名

      IEEE Access

      巻: 11 ページ: 18157-18182

    • DOI

      10.1109/access.2023.3246638

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] CLAP_CDC wins Chinese dark chess tournament2023

    • 著者名/発表者名
      Hsueh Chu-Hsuan、Chen Jr-Chang
    • 雑誌名

      ICGA Journal

      巻: 44 号: 3 ページ: 114-118

    • DOI

      10.3233/icg-230220

    • 関連する報告書
      2022 実施状況報告書
    • 国際共著
  • [学会発表] 未知の場を短時間で学習するドミニオンAI2023

    • 著者名/発表者名
      田中開士, 橋本剛
    • 学会等名
      ゲームプログラミングワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] HandyRLによるナポレオンAI2023

    • 著者名/発表者名
      高木 利幸,橋本 剛
    • 学会等名
      ゲームプログラミングワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Transformerによる過去対戦を利用したガイスター駒種推定2023

    • 著者名/発表者名
      錦織光司, 橋本 剛
    • 学会等名
      ゲームプログラミングワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 上海ゲームの工夫が報われる問題生成のための人間の記憶選択と忘却のモデル2023

    • 著者名/発表者名
      相良 駿昇,シュエ ジュウシュエン,池田 心
    • 学会等名
      ゲームプログラミングワークショップ2023
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] An Empirical Analysis of Gumbel MuZero on Stochastic and Deterministic Einstein Wurfelt Nicht!2023

    • 著者名/発表者名
      Chien-Liang Kuo, Po-Ting Chen, Hung Guei, De-Rong Sung, Chu-Hsuan Hsueh, Ti-Rong Wu, and I-Chen Wu
    • 学会等名
      The 28th International Conference on Technologies and Applications of Artificial Intelligence (TAAI 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会
  • [学会発表] 不完全情報同時手番ゲームにおいて人間のような読み合いを演出するAIプレイヤ2023

    • 著者名/発表者名
      小西 健太郎,池田 心,シュエ ジュウシュエン
    • 学会等名
      第49回情報処理学会ゲーム情報学研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 格闘ゲーム初心者のための読み合い理解支援システムの改善2023

    • 著者名/発表者名
      酒見 真,シュエ ジュウシュエン,池田 心
    • 学会等名
      第49回情報処理学会ゲーム情報学研究会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] UCTを用いたガイスターAIの研究2022

    • 著者名/発表者名
      錦織 光司 , 青木 蓮樹 , 橋本 剛
    • 学会等名
      ゲームプログラミングワークショップ2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] UCTに方策勾配法を用いるガイスターAIの研究2022

    • 著者名/発表者名
      青木 蓮樹 , 橋本 剛
    • 学会等名
      ゲームプログラミングワークショップ2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] ゲームAIへの認知バイアス・生物学的制約の導入に向けた人間の行動選択に関する分析2022

    • 著者名/発表者名
      坂本 洸,シュエ ジュウシュエン,池田 心
    • 学会等名
      ゲームプログラミングワークショップ2022
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 格闘ゲーム初心者のための読み合い理解支援システム2022

    • 著者名/発表者名
      酒見 真,シュエ ジュウシュエン,池田 心
    • 学会等名
      ゲームプログラミングワークショップ2022
    • 関連する報告書
      2022 実施状況報告書
  • [図書] ゲームAI研究の新展開2023

    • 著者名/発表者名
      橋本 剛, 伊藤毅志
    • 総ページ数
      360
    • 出版者
      オーム社
    • ISBN
      9784274230776
    • 関連する報告書
      2023 実施状況報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi