• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Machine learning and distributed game-tree search in games

Research Project

Project/Area Number 16H02927
Research InstitutionThe University of Tokyo

Principal Investigator

金子 知適  東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)

Project Period (FY) 2016-04-01 – 2019-03-31
Keywordsゲームプログラミング
Outline of Annual Research Achievements

本応募課題では,思考ゲームを題材に並列分散探索と機械学習の隣接部分について理論と実装の両面から研究を進め,汎用性のあるフレームワークを構築する.現在では広い研究テーマで大規模な機械学習が必要とされている.思考ゲームでも囲碁将棋の評価関数や方策の獲得を基礎に,プレイスタイルや局面解説など挑戦的なテーマにまで及ぶ.そのような大規模な学習を現実的な時間で行うためには,並列分散計算の活用が肝要であるが,実用化は容易ではなかった.最終年度である本年度ではこれまでの研究を基礎として Uniformity regularizationというあらたな学習方式を提案した。またtensorflow及びchainer上で実装し、提案手法が並列・分散環境での学習に適することを、囲碁、将棋、チェスを題材に示した。主要な成果は、囲碁についてはAn Alternative Multitask Training for Evaluation Functions in the Game of Goに、将棋とチェスについてはHeterogeneous Multi-Task Learning of Evaluation Functions for Chess and ShogiおよびBuilding Evaluation Functions for Chess and Shogi with Uniformity Regularization Networksにまとめられている。

Research Progress Status

平成30年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

平成30年度が最終年度であるため、記入しない。

  • Research Products

    (18 results)

All 2018

All Journal Article (17 results) (of which Peer Reviewed: 17 results,  Open Access: 10 results) Presentation (1 results)

  • [Journal Article] Heterogeneous Multi-Task Learning of Evaluation Functions for Chess and Shogi2018

    • Author(s)
      Shanchuan Wan and Tomoyuki Kaneko
    • Journal Title

      ICONIP 2018

      Volume: 3 Pages: 347--358

    • DOI

      10.1007/978-3-030-04182-3_31

    • Peer Reviewed
  • [Journal Article] Building Evaluation Functions for Chess and Shogi with Uniformity Regularization Networks2018

    • Author(s)
      Shanchuan Wan and Tomoyuki Kaneko
    • Journal Title

      IEEE Conference on Computational Intelligence and Games 2018

      Volume: - Pages: 70--77

    • DOI

      10.1109/CIG.2018.8490455

    • Peer Reviewed
  • [Journal Article] An Alternative Multitask Training for Evaluation Functions in the Game of Go2018

    • Author(s)
      Yusaku Mandai and Tomoyuki Kaneko
    • Journal Title

      IEEE Technologies and Applications of Artificial Intelligence

      Volume: - Pages: 132--135

    • DOI

      10.1109/TAAI.2018.00037

    • Peer Reviewed
  • [Journal Article] Learning of Evaluation Functions via Self-Play Enhanced by Checkmate Search2018

    • Author(s)
      Taichi Nakayashiki and Tomoyuki Kaneko
    • Journal Title

      IEEE Technologies and Applications of Artificial Intelligence

      Volume: - Pages: 126--131

    • DOI

      10.1109/TAAI.2018.00036

    • Peer Reviewed
  • [Journal Article] Comparison of Loss Functions for Training of Deep Neural Networks in Shogi2018

    • Author(s)
      Hanhua Zhu and Tomoyuki Kaneko
    • Journal Title

      IEEE Technologies and Applications of Artificial Intelligence

      Volume: - Pages: 18--23

    • DOI

      DOI 10.1109/TAAI.2018.00014

    • Peer Reviewed
  • [Journal Article] Deep Recurrent Q-Network with Truncated History2018

    • Author(s)
      Hyunwoo Oh and Tomoyuki Kaneko
    • Journal Title

      IEEE Technologies and Applications of Artificial Intelligence

      Volume: - Pages: 34--39

    • DOI

      DOI 10.1109/TAAI.2018.00017

    • Peer Reviewed
  • [Journal Article] Application of Deep Reinforcement Learning in Werewolf Game Agents2018

    • Author(s)
      Tianhe Wang and Tomoyuki Kaneko
    • Journal Title

      IEEE Technologies and Applications of Artificial Intelligence

      Volume: - Pages: 28--33

    • DOI

      10.1109/TAAI.2018.00016

    • Peer Reviewed
  • [Journal Article] Playing the Flappy Bird with Reinforcement Learning Algorithms2018

    • Author(s)
      Hanhua Zhu and Tomoyuki Kaneko
    • Journal Title

      The 23rd Game Programming Workshop

      Volume: - Pages: 153--159

    • Peer Reviewed / Open Access
  • [Journal Article] Counterfactual Regret Minimization for the Board Game Geister2018

    • Author(s)
      Chen Chen and Tomoyuki Kaneko
    • Journal Title

      The 23rd Game Programming Workshop

      Volume: - Pages: 137--144

    • Peer Reviewed / Open Access
  • [Journal Article] Pos2Pos: Automatic Position-to-Position Translation in Chess-Like Games2018

    • Author(s)
      Shanchuan Wan and Tomoyuki Kaneko
    • Journal Title

      The 23rd Game Programming Workshop

      Volume: - Pages: 51--54

    • Peer Reviewed / Open Access
  • [Journal Article] Reinforcement Learning with Effective Exploitation of Experiences on Mini-Games of StarCraft II2018

    • Author(s)
      ZheJie Hu and Tomoyuki Kaneko
    • Journal Title

      The 23rd Game Programming Workshop

      Volume: - Pages: 168--174

    • Peer Reviewed / Open Access
  • [Journal Article] 囲碁ニューラルネットワークの判断根拠の可視化2018

    • Author(s)
      万代悠作 金子知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 9--15

    • Peer Reviewed / Open Access
  • [Journal Article] 将棋用ニューラルネットワークへの顕著性抽出手法の適用2018

    • Author(s)
      中屋敷 太一 金子 知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 1--8

    • Peer Reviewed / Open Access
  • [Journal Article] ローグライクゲームによる強化学習ベンチマーク環境Rogue-Gymの提案2018

    • Author(s)
      金川裕司 金子 知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 120--127

    • Peer Reviewed / Open Access
  • [Journal Article] 人狼エージェントにおける深層Qネットワークの応用2018

    • Author(s)
      王 天鶴 金子 知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 16--22

    • Peer Reviewed / Open Access
  • [Journal Article] LSTM の初期状態の学習による DRQN の改善2018

    • Author(s)
      Oh Hyunwoo 金子 知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 220--227

    • Peer Reviewed / Open Access
  • [Journal Article] 階層を考慮した模倣学習と強化学習の組み合わせ2018

    • Author(s)
      藤村 悠太朗 金子 知適
    • Journal Title

      第23回ゲームプログラミングワークショップ

      Volume: - Pages: 145--152

    • Peer Reviewed / Open Access
  • [Presentation] 様々な学習戦略と学習環境におけるHybrid Reward Architectureの性能の評価2018

    • Author(s)
      藤村 悠太朗 金子 知適
    • Organizer
      人工知能学会全国大会

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi