2016 Fiscal Year Annual Research Report

Large scale distributed monte-carlo game-tree search based on probability distribution

Research Project

Project/Area Number	26280130
Research Institution	The University of Tokyo
Principal Investigator	横山大作東京大学, 生産技術研究所, 助教 (80345272)
Project Period (FY)	2014-04-01 – 2017-03-31
Keywords	人工知能 / アルゴリズム / ゲーム情報学
Outline of Annual Research Achievements	現実世界の大規模な探索問題は全解探索は困難であり、有用そうな部分を選択的に探索するアルゴリズムが用いられる。ゲーム木の探索はこのような問題の一例であり、近年提案されたモンテカルロ木探索がその有効性から広まっているが、将棋など「細い正解の一本道をたどらねばならない」ような問題領域においては収束が遅く、適用が難しい。我々は、局面評価値の確率分布をゲーム木でそのまま扱えるベイジアンアプローチに基づいた探索アルゴリズムを提案し、将棋での有効性を確認しつつあるが、並列計算手法が未検討であり、大規模問題を解くうえでの障害となっている。本年度は、前年度までに行ったアルゴリズムの詳細設計、及び性能評価用実装による性能面での検討成果をもとに、実用性を考慮したシステム実装を行い、評価を行った。また、提案手法の応用分野の拡大を図るため、多人数不完全情報ゲームなどのコンピュータプレイヤの構築と機械学習の適用、特に強化学習の適用に関する研究を行い、それぞれの研究成果を研究会において論文発表した。これらのゲームプレイヤに関する知見はそのままでは現在のモンテカルロ木探索手法に適用できるものではないが、今回の研究でターゲットとしている将棋プレイヤの実用性を向上させるための基礎研究として役立てられた。また、これらの問題領域へアプローチできるよう、今回の研究内容を発展させる際の方針の明確化、並びに課題の確認を行うことができた。
Research Progress Status	28年度が最終年度であるため、記入しない。
Strategy for Future Research Activity	28年度が最終年度であるため、記入しない。
Causes of Carryover	28年度が最終年度であるため、記入しない。
Expenditure Plan for Carryover Budget	28年度が最終年度であるため、記入しない。

Research Products
(4 results)

All 2016

All Presentation (4 results)

[Presentation] 強化学習を用いた効率的な和了を行う麻雀プレイヤ2016
- Author(s)
  水上直紀，鶴岡慶雅
- Organizer
  第21回ゲームプログラミングワークショップ
- Place of Presentation
  箱根セミナーハウス(神奈川県)
- Year and Date
  2016-11-04 – 2016-11-06
[Presentation] 将棋における個人に適応した着手推定モデルの構築2016
- Author(s)
  山内智晴，鶴岡慶雅
- Organizer
  第21回ゲームプログラミングワークショップ
- Place of Presentation
  箱根セミナーハウス(神奈川県)
- Year and Date
  2016-11-04 – 2016-11-06
[Presentation] 多人数不完全情報ゲームにおける仮想自己対戦を用いた強化学習2016
- Author(s)
  河村圭悟，水上直紀，鶴岡慶雅
- Organizer
  第21回ゲームプログラミングワークショップ
- Place of Presentation
  箱根セミナーハウス(神奈川県)
- Year and Date
  2016-11-04 – 2016-11-06
[Presentation] 線形関数近似によるトリックテイキングゲームのQ学習2016
- Author(s)
  齋藤雄太，鶴岡慶雅
- Organizer
  第21回ゲームプログラミングワークショップ
- Place of Presentation
  箱根セミナーハウス(神奈川県)
- Year and Date
  2016-11-04 – 2016-11-06

2016 Fiscal Year Annual Research Report

Large scale distributed monte-carlo game-tree search based on probability distribution

Principal Investigator

横山 大作 東京大学, 生産技術研究所, 助教 (80345272)

Research Products

[Presentation] 強化学習を用いた効率的な和了を行う麻雀プレイヤ2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 将棋における個人に適応した着手推定モデルの構築2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 多人数不完全情報ゲームにおける仮想自己対戦を用いた強化学習2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 線形関数近似によるトリックテイキングゲームのQ学習2016

Author(s)

Organizer

Place of Presentation

Year and Date

横山大作東京大学, 生産技術研究所, 助教 (80345272)