2018 Fiscal Year Annual Research Report

Machine learning and distributed game-tree search in games

Research Project

Project/Area Number	16H02927
Research Institution	The University of Tokyo
Principal Investigator	金子知適東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)
Project Period (FY)	2016-04-01 – 2019-03-31
Keywords	ゲームプログラミング
Outline of Annual Research Achievements	本応募課題では，思考ゲームを題材に並列分散探索と機械学習の隣接部分について理論と実装の両面から研究を進め，汎用性のあるフレームワークを構築する．現在では広い研究テーマで大規模な機械学習が必要とされている．思考ゲームでも囲碁将棋の評価関数や方策の獲得を基礎に，プレイスタイルや局面解説など挑戦的なテーマにまで及ぶ．そのような大規模な学習を現実的な時間で行うためには，並列分散計算の活用が肝要であるが，実用化は容易ではなかった．最終年度である本年度ではこれまでの研究を基礎として Uniformity regularizationというあらたな学習方式を提案した。またtensorflow及びchainer上で実装し、提案手法が並列・分散環境での学習に適することを、囲碁、将棋、チェスを題材に示した。主要な成果は、囲碁についてはAn Alternative Multitask Training for Evaluation Functions in the Game of Goに、将棋とチェスについてはHeterogeneous Multi-Task Learning of Evaluation Functions for Chess and ShogiおよびBuilding Evaluation Functions for Chess and Shogi with Uniformity Regularization Networksにまとめられている。
Research Progress Status	平成30年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	平成30年度が最終年度であるため、記入しない。

Research Products
(18 results)

All 2018

All Journal Article (17 results) (of which Peer Reviewed: 17 results, Open Access: 10 results) Presentation (1 results)

[Journal Article] Heterogeneous Multi-Task Learning of Evaluation Functions for Chess and Shogi2018
- Author(s)
  Shanchuan Wan and Tomoyuki Kaneko
- Journal Title
  
  ICONIP 2018
  
  Volume: 3 Pages: 347--358
- DOI
  10.1007/978-3-030-04182-3_31
- Peer Reviewed
[Journal Article] Building Evaluation Functions for Chess and Shogi with Uniformity Regularization Networks2018
- Author(s)
  Shanchuan Wan and Tomoyuki Kaneko
- Journal Title
  
  IEEE Conference on Computational Intelligence and Games 2018
  
  Volume: - Pages: 70--77
- DOI
  10.1109/CIG.2018.8490455
- Peer Reviewed
[Journal Article] An Alternative Multitask Training for Evaluation Functions in the Game of Go2018
- Author(s)
  Yusaku Mandai and Tomoyuki Kaneko
- Journal Title
  
  IEEE Technologies and Applications of Artificial Intelligence
  
  Volume: - Pages: 132--135
- DOI
  10.1109/TAAI.2018.00037
- Peer Reviewed
[Journal Article] Learning of Evaluation Functions via Self-Play Enhanced by Checkmate Search2018
- Author(s)
  Taichi Nakayashiki and Tomoyuki Kaneko
- Journal Title
  
  IEEE Technologies and Applications of Artificial Intelligence
  
  Volume: - Pages: 126--131
- DOI
  10.1109/TAAI.2018.00036
- Peer Reviewed
[Journal Article] Comparison of Loss Functions for Training of Deep Neural Networks in Shogi2018
- Author(s)
  Hanhua Zhu and Tomoyuki Kaneko
- Journal Title
  
  IEEE Technologies and Applications of Artificial Intelligence
  
  Volume: - Pages: 18--23
- DOI
  DOI 10.1109/TAAI.2018.00014
- Peer Reviewed
[Journal Article] Deep Recurrent Q-Network with Truncated History2018
- Author(s)
  Hyunwoo Oh and Tomoyuki Kaneko
- Journal Title
  
  IEEE Technologies and Applications of Artificial Intelligence
  
  Volume: - Pages: 34--39
- DOI
  DOI 10.1109/TAAI.2018.00017
- Peer Reviewed
[Journal Article] Application of Deep Reinforcement Learning in Werewolf Game Agents2018
- Author(s)
  Tianhe Wang and Tomoyuki Kaneko
- Journal Title
  
  IEEE Technologies and Applications of Artificial Intelligence
  
  Volume: - Pages: 28--33
- DOI
  10.1109/TAAI.2018.00016
- Peer Reviewed
[Journal Article] Playing the Flappy Bird with Reinforcement Learning Algorithms2018
- Author(s)
  Hanhua Zhu and Tomoyuki Kaneko
- Journal Title
  
  The 23rd Game Programming Workshop
  
  Volume: - Pages: 153--159
- Peer Reviewed / Open Access
[Journal Article] Counterfactual Regret Minimization for the Board Game Geister2018
- Author(s)
  Chen Chen and Tomoyuki Kaneko
- Journal Title
  
  The 23rd Game Programming Workshop
  
  Volume: - Pages: 137--144
- Peer Reviewed / Open Access
[Journal Article] Pos2Pos: Automatic Position-to-Position Translation in Chess-Like Games2018
- Author(s)
  Shanchuan Wan and Tomoyuki Kaneko
- Journal Title
  
  The 23rd Game Programming Workshop
  
  Volume: - Pages: 51--54
- Peer Reviewed / Open Access
[Journal Article] Reinforcement Learning with Effective Exploitation of Experiences on Mini-Games of StarCraft II2018
- Author(s)
  ZheJie Hu and Tomoyuki Kaneko
- Journal Title
  
  The 23rd Game Programming Workshop
  
  Volume: - Pages: 168--174
- Peer Reviewed / Open Access
[Journal Article] 囲碁ニューラルネットワークの判断根拠の可視化2018
- Author(s)
  万代悠作金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 9--15
- Peer Reviewed / Open Access
[Journal Article] 将棋用ニューラルネットワークへの顕著性抽出手法の適用2018
- Author(s)
  中屋敷太一金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 1--8
- Peer Reviewed / Open Access
[Journal Article] ローグライクゲームによる強化学習ベンチマーク環境Rogue-Gymの提案2018
- Author(s)
  金川裕司金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 120--127
- Peer Reviewed / Open Access
[Journal Article] 人狼エージェントにおける深層Qネットワークの応用2018
- Author(s)
  王天鶴金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 16--22
- Peer Reviewed / Open Access
[Journal Article] LSTM の初期状態の学習による DRQN の改善2018
- Author(s)
  Oh Hyunwoo 金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 220--227
- Peer Reviewed / Open Access
[Journal Article] 階層を考慮した模倣学習と強化学習の組み合わせ2018
- Author(s)
  藤村悠太朗金子知適
- Journal Title
  
  第23回ゲームプログラミングワークショップ
  
  Volume: - Pages: 145--152
- Peer Reviewed / Open Access
[Presentation] 様々な学習戦略と学習環境におけるHybrid Reward Architectureの性能の評価2018
- Author(s)
  藤村悠太朗金子知適
- Organizer
  人工知能学会全国大会

2018 Fiscal Year Annual Research Report

Machine learning and distributed game-tree search in games

Principal Investigator

金子 知適 東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)

Research Products

[Journal Article] Heterogeneous Multi-Task Learning of Evaluation Functions for Chess and Shogi2018

Author(s)

Journal Title

DOI

[Journal Article] Building Evaluation Functions for Chess and Shogi with Uniformity Regularization Networks2018

Author(s)

Journal Title

DOI

[Journal Article] An Alternative Multitask Training for Evaluation Functions in the Game of Go2018

Author(s)

Journal Title

DOI

[Journal Article] Learning of Evaluation Functions via Self-Play Enhanced by Checkmate Search2018

Author(s)

Journal Title

DOI

[Journal Article] Comparison of Loss Functions for Training of Deep Neural Networks in Shogi2018

Author(s)

Journal Title

DOI

[Journal Article] Deep Recurrent Q-Network with Truncated History2018

Author(s)

Journal Title

DOI

[Journal Article] Application of Deep Reinforcement Learning in Werewolf Game Agents2018

Author(s)

Journal Title

DOI

[Journal Article] Playing the Flappy Bird with Reinforcement Learning Algorithms2018

Author(s)

Journal Title

[Journal Article] Counterfactual Regret Minimization for the Board Game Geister2018

Author(s)

Journal Title

[Journal Article] Pos2Pos: Automatic Position-to-Position Translation in Chess-Like Games2018

Author(s)

Journal Title

[Journal Article] Reinforcement Learning with Effective Exploitation of Experiences on Mini-Games of StarCraft II2018

Author(s)

Journal Title

[Journal Article] 囲碁ニューラルネットワークの判断根拠の可視化2018

Author(s)

Journal Title

[Journal Article] 将棋用ニューラルネットワークへの顕著性抽出手法の適用2018

Author(s)

Journal Title

[Journal Article] ローグライクゲームによる強化学習ベンチマーク環境Rogue-Gymの提案2018

Author(s)

Journal Title

[Journal Article] 人狼エージェントにおける深層Qネットワークの応用2018

Author(s)

Journal Title

[Journal Article] LSTM の初期状態の学習による DRQN の改善2018

Author(s)

Journal Title

[Journal Article] 階層を考慮した模倣学習と強化学習の組み合わせ2018

Author(s)

Journal Title

[Presentation] 様々な学習戦略と学習環境におけるHybrid Reward Architectureの性能の評価2018

Author(s)

Organizer

金子知適東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)