• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

思考ゲームの並列分散探索と機械学習基盤

研究課題

研究課題/領域番号 16H02927
研究種目

基盤研究(B)

配分区分補助金
応募区分一般
研究分野 エンタテインメント・ゲーム情報学
研究機関東京大学

研究代表者

金子 知適  東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)

研究期間 (年度) 2016-04-01 – 2019-03-31
研究課題ステータス 完了 (2018年度)
配分額 *注記
5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2016年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
キーワードゲームプログラミング / ゲーム情報学 / 人工知能 / 機械学習 / 並列計算
研究成果の概要

アルファ碁が人工知能全体の進歩として社会に衝撃を与えたように,ゲームを題材として人工知能研究はめざましく進歩している.この研究課題では,ゲームAIの賢さを実現する機械学習(特に強化学習)とゲーム木探索という基礎技術を研究した.さらに,並列分散計算を活用した高速化にも取り組んだ.現在の強化学習の枠組みではAIが賢さを身につけるために膨大の計算時間が必要で,社会で広く使うことが難しいためである.

研究成果の学術的意義や社会的意義

研究計画の通りに機械学習とゲーム木探索とその並列実行について研究した.また採択後に大きく発展したAlphaGoに代表するGPU計算と強化学習についても,最新技術を研究に反映させた.成果の一つであるUniformity regularizationという学習方式については,tensorflow及びchainer上で実装し,囲碁,将棋,チェスなど代表的なゲームを題材に性能を示した.成果全体を総合して15件の論文を公表した.

報告書

(4件)
  • 2018 実績報告書   研究成果報告書 ( PDF )
  • 2017 実績報告書
  • 2016 実績報告書
  • 研究成果

    (39件)

すべて 2018 2017 2016

すべて 雑誌論文 (28件) (うち査読あり 27件、 オープンアクセス 11件、 謝辞記載あり 4件) 学会発表 (11件) (うち国際学会 1件、 招待講演 1件)

  • [雑誌論文] Heterogeneous Multi-Task Learning of Evaluation Functions for Chess and Shogi2018

    • 著者名/発表者名
      Shanchuan Wan and Tomoyuki Kaneko
    • 雑誌名

      ICONIP 2018

      巻: 3 ページ: 347-358

    • DOI

      10.1007/978-3-030-04182-3_31

    • ISBN
      9783030041816, 9783030041823
    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] Building Evaluation Functions for Chess and Shogi with Uniformity Regularization Networks2018

    • 著者名/発表者名
      Shanchuan Wan and Tomoyuki Kaneko
    • 雑誌名

      IEEE Conference on Computational Intelligence and Games 2018

      巻: - ページ: 1-8

    • DOI

      10.1109/cig.2018.8490455

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] An Alternative Multitask Training for Evaluation Functions in the Game of Go2018

    • 著者名/発表者名
      Yusaku Mandai and Tomoyuki Kaneko
    • 雑誌名

      IEEE Technologies and Applications of Artificial Intelligence

      巻: - ページ: 132-135

    • DOI

      10.1109/taai.2018.00037

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Learning of Evaluation Functions via Self-Play Enhanced by Checkmate Search2018

    • 著者名/発表者名
      Taichi Nakayashiki and Tomoyuki Kaneko
    • 雑誌名

      IEEE Technologies and Applications of Artificial Intelligence

      巻: - ページ: 126-131

    • DOI

      10.1109/taai.2018.00036

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] Comparison of Loss Functions for Training of Deep Neural Networks in Shogi2018

    • 著者名/発表者名
      Hanhua Zhu and Tomoyuki Kaneko
    • 雑誌名

      IEEE Technologies and Applications of Artificial Intelligence

      巻: - ページ: 18-23

    • DOI

      10.1109/taai.2018.00014

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] Deep Recurrent Q-Network with Truncated History2018

    • 著者名/発表者名
      Hyunwoo Oh and Tomoyuki Kaneko
    • 雑誌名

      IEEE Technologies and Applications of Artificial Intelligence

      巻: - ページ: 34-39

    • DOI

      10.1109/taai.2018.00017

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] Application of Deep Reinforcement Learning in Werewolf Game Agents2018

    • 著者名/発表者名
      Tianhe Wang and Tomoyuki Kaneko
    • 雑誌名

      IEEE Technologies and Applications of Artificial Intelligence

      巻: - ページ: 28-33

    • DOI

      10.1109/taai.2018.00016

    • 関連する報告書
      2018 実績報告書
    • 査読あり
  • [雑誌論文] Playing the Flappy Bird with Reinforcement Learning Algorithms2018

    • 著者名/発表者名
      Hanhua Zhu and Tomoyuki Kaneko
    • 雑誌名

      The 23rd Game Programming Workshop

      巻: -

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Counterfactual Regret Minimization for the Board Game Geister2018

    • 著者名/発表者名
      Chen Chen and Tomoyuki Kaneko
    • 雑誌名

      The 23rd Game Programming Workshop

      巻: -

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Pos2Pos: Automatic Position-to-Position Translation in Chess-Like Games2018

    • 著者名/発表者名
      Shanchuan Wan and Tomoyuki Kaneko
    • 雑誌名

      The 23rd Game Programming Workshop

      巻: -

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Reinforcement Learning with Effective Exploitation of Experiences on Mini-Games of StarCraft II2018

    • 著者名/発表者名
      ZheJie Hu and Tomoyuki Kaneko
    • 雑誌名

      The 23rd Game Programming Workshop

      巻: -

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 囲碁ニューラルネットワークの判断根拠の可視化2018

    • 著者名/発表者名
      万代悠作 金子知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178461

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 将棋用ニューラルネットワークへの顕著性抽出手法の適用2018

    • 著者名/発表者名
      中屋敷 太一 金子 知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178460

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] ローグライクゲームによる強化学習ベンチマーク環境Rogue-Gymの提案2018

    • 著者名/発表者名
      金川裕司 金子 知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178478

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 人狼エージェントにおける深層Qネットワークの応用2018

    • 著者名/発表者名
      王 天鶴 金子 知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178462

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] LSTM の初期状態の学習による DRQN の改善2018

    • 著者名/発表者名
      Oh Hyunwoo 金子 知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178493

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] 階層を考慮した模倣学習と強化学習の組み合わせ2018

    • 著者名/発表者名
      藤村 悠太朗 金子 知適
    • 雑誌名

      第23回ゲームプログラミングワークショップ

      巻: -

    • NAID

      170000178482

    • 関連する報告書
      2018 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Estimating the maximum expected value through upper confidence bound of likelihood. Technologies and Applications of Artificial Intelligence2017

    • 著者名/発表者名
      Takahisa Imagawa and Tomoyuki Kaneko
    • 雑誌名

      Technologies and Applications of Artificial Intelligence

      巻: -

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] Imitation Learning for Playing Shogi Based on Generative Adversarial Networks Technologies and Applications of Artificial Intelligence2017

    • 著者名/発表者名
      Shanchuan Wan and Tomoyuki Kaneko
    • 雑誌名

      Technologies and Applications of Artificial Intelligence

      巻: -

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] モンテカルロ木探索における状態価値の推定方法の改善2017

    • 著者名/発表者名
      今川 孝久, 金子 知適
    • 雑誌名

      ゲームプログラミングワークショップ予稿集

      巻: - ページ: 34-41

    • NAID

      170000176046

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] 局面の組合せを用いた囲碁評価関数の学習2017

    • 著者名/発表者名
      万代 悠作, 金子 知適
    • 雑誌名

      ゲームプログラミングワークショップ予稿集

      巻: - ページ: 8-14

    • NAID

      170000176042

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] GVG-AI のための Monte Carlo Tree Search の改善に関する研究2017

    • 著者名/発表者名
      OH HYUNWOO, 金子 知適
    • 雑誌名

      ゲームプログラミングワークショップ予稿集

      巻: - ページ: 56-63

    • NAID

      170000176049

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] 強化学習を用いた評価関数の作成手法の信頼性の分析2017

    • 著者名/発表者名
      嶽 俊太郎, 金子 知適
    • 雑誌名

      ゲームプログラミングワークショップ予稿集

      巻: - ページ: 250-257

    • NAID

      170000176079

    • 関連する報告書
      2017 実績報告書
    • 査読あり
  • [雑誌論文] Improved LinUCT and Its Evaluation on Incremental Random-Feature Tree2016

    • 著者名/発表者名
      Y. Mandai and T. Kaneko
    • 雑誌名

      IEEE Computational Intelligence and Games

      巻: 2325-4289 ページ: 1-8

    • DOI

      10.1109/cig.2016.7860440

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Monte Carlo Tree Search with Robust Exploration2016

    • 著者名/発表者名
      T. Imagawa and T. Kaneko
    • 雑誌名

      LNCS, Computers and Games

      巻: 10068 ページ: 34-46

    • DOI

      10.1007/978-3-319-50935-8_4

    • ISBN
      9783319509341, 9783319509358
    • 関連する報告書
      2016 実績報告書
    • 査読あり
  • [雑誌論文] 確率的勾配降下法を用いたLinUCT のスケーラビリティの改善2016

    • 著者名/発表者名
      万代悠作, 金子知適
    • 雑誌名

      情報処理学会論文誌

      巻: 57(11) ページ: 2328-2336

    • NAID

      170000131089

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] LinUCB Applied to Monte Carlo Tree Search2016

    • 著者名/発表者名
      Y. Mandai and T. Kaneko
    • 雑誌名

      Theoretical Computer Science

      巻: 644(6) ページ: 114-126

    • DOI

      10.1016/j.tcs.2016.06.035

    • NAID

      170000087238

    • 関連する報告書
      2016 実績報告書
    • 査読あり / 謝辞記載あり
  • [雑誌論文] Learning of Evaluation Functions to Realize Playing Styles in Shogi2016

    • 著者名/発表者名
      S. Omori and T. Kaneko
    • 雑誌名

      LNCS, PRICAI

      巻: 9810 ページ: 367-379

    • DOI

      10.1007/978-3-319-42911-3_31

    • ISBN
      9783319429106, 9783319429113
    • 関連する報告書
      2016 実績報告書
    • 謝辞記載あり
  • [学会発表] 様々な学習戦略と学習環境におけるHybrid Reward Architectureの性能の評価2018

    • 著者名/発表者名
      藤村 悠太朗 金子 知適
    • 学会等名
      人工知能学会全国大会
    • 関連する報告書
      2018 実績報告書
  • [学会発表] Settlers of Catanにおけるマップ自動生成の研究2017

    • 著者名/発表者名
      黄 柱皓, 金子 知適
    • 学会等名
      ゲームプログラミングワークショップ2017
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Style Transfer in Playing Shogi Based on Generative Adversarial Networks2017

    • 著者名/発表者名
      Shanchuan Wan and Tomoyuki Kaneko
    • 学会等名
      ゲームプログラミングワークショップ2017
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 将棋における勾配ブースティング木を用いた評価関数2017

    • 著者名/発表者名
      渡辺 敬介, 金子 知適
    • 学会等名
      ゲームプログラミングワークショップ2017
    • 関連する報告書
      2017 実績報告書
  • [学会発表] 人狼ゲームエージェントにおける行動選択手法の比較2017

    • 著者名/発表者名
      王 天鶴, 金子 知適
    • 学会等名
      ゲームプログラミングワークショップ
    • 関連する報告書
      2017 実績報告書
  • [学会発表] Hybrid Reward Architecture を用いたリアルタイムな意思決定の改善2017

    • 著者名/発表者名
      藤村 悠太朗, 金子 知適
    • 学会等名
      ゲームプログラミングワークショップ
    • 関連する報告書
      2017 実績報告書
  • [学会発表] ゲーム木に基づく並列探索での下位局面の分担2016

    • 著者名/発表者名
      横山秀, 金子知適
    • 学会等名
      ゲーム・プログラミング ワークショップ 2016
    • 発表場所
      箱根セミナーハウス(神奈川県・箱根)
    • 年月日
      2016-11-04
    • 関連する報告書
      2016 実績報告書
  • [学会発表] モンテカルロ木探索における子孫の勝敗確定時のプレイアウト結果の修正2016

    • 著者名/発表者名
      今川孝久, 金子知適
    • 学会等名
      ゲーム・プログラミング ワークショップ 2016
    • 発表場所
      箱根セミナーハウス(神奈川県・箱根)
    • 年月日
      2016-11-04
    • 関連する報告書
      2016 実績報告書
  • [学会発表] 経験的知識と類似局面を用いた証明数探索の効率化2016

    • 著者名/発表者名
      島野拓也, 金子知適
    • 学会等名
      ゲーム・プログラミング ワークショップ 2016
    • 発表場所
      箱根セミナーハウス(神奈川県・箱根)
    • 年月日
      2016-11-04
    • 関連する報告書
      2016 実績報告書
  • [学会発表] UCT における Prior knowledge と方策学習を用いた個性の実現2016

    • 著者名/発表者名
      渡辺順哉, 金子知適
    • 学会等名
      ゲーム・プログラミング ワークショップ 2016
    • 発表場所
      箱根セミナーハウス(神奈川県・箱根)
    • 年月日
      2016-11-04
    • 関連する報告書
      2016 実績報告書
  • [学会発表] Machine Learning of Evaluation Functions and Playing Styles in Shogi2016

    • 著者名/発表者名
      T. Kaneko
    • 学会等名
      TCGA
    • 発表場所
      台中(台湾)
    • 年月日
      2016-06-04
    • 関連する報告書
      2016 実績報告書
    • 国際学会 / 招待講演

URL: 

公開日: 2016-04-21   更新日: 2020-03-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi