2017 Fiscal Year Annual Research Report

複数の評価手法を利用可能な大規模分散モンテカルロ木探索

Research Project

Project/Area Number	17H01846
Research Institution	Meiji University
Principal Investigator	横山大作明治大学, 理工学部, 専任准教授 (80345272)
Project Period (FY)	2017-04-01 – 2020-03-31
Keywords	人工知能 / アルゴリズム / ゲーム情報学
Outline of Annual Research Achievements	現実世界の大規模な探索問題は全解探索は困難であり、一部を選択的に探索するアルゴリズムが用いられる。ゲーム木の探索はこのような問題の一例であり、モンテカルロ木探索が有効とされているが、将棋など「細い正解の一本道をたどらねばならない」ような問題領域においては収束が遅く、適用が難しい。我々は、乱数を組み込んだ探索を利用するアルゴリズムを提案し、将棋での有効性を確認したが、単一の評価関数を用いることによる効率の悪さも明らかになった。本研究では、(1)性質の異なる複数の評価手法を活用できるモンテカルロ木探索手法を検討し、(2)将棋を題材に実用的なアプリケーションとして実装を行い、(3)大規模分散計算環境でその有効性を評価する、ことを目指す。本年度は、複数の評価手法を利用可能な分散モンテカルロ木探索アルゴリズムを設計し、実用的な問題におけるアプリケーションとして、コンピュータ将棋プレイヤ「激指」を用いて分散計算アプリケーションの試験実装を行うとともに、その有効性を試験評価した。また、提案手法の応用範囲を拡大するため、交渉ゲームやRPGなど、より複雑な状況を扱う必要がある困難な問題に関する研究を行った。さらに、様々な実用的探索アプリケーションにおいて近年有望な手法とされている強化学習に関する研究を行った。これらの研究成果は、提案手法の基本設計や詳細設計、実装などで、実社会問題への応用性を高めるために活用していく。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 今年度の計画目標は、探索アルゴリズムの設計と、分散計算アプリケーションの試験実装であった。これらの目標を順調に達成することができ、おおむね計画通りに進展していると言える。
Strategy for Future Research Activity	これまでの研究は計画に従っておおむね順調に進展しているため、今後も計画に従って研究をしていく。

Research Products
(4 results)

All 2018 2017

All Journal Article (1 results) Presentation (3 results)

[Journal Article] KDD参加報告2018
- Author(s)
  横山大作
- Journal Title
  
  コンピュータソフトウェア
  
  Volume: 35 Pages: 86-89
[Presentation] Counterfactual Regret Minimization による交渉ゲームの求解2017
- Author(s)
  藤本海右, 鶴岡慶雅
- Organizer
  第22回ゲームプログラミングワークショップ
[Presentation] 内部報酬を自動生成する強化学習による一人用RPGの自動攻略2017
- Author(s)
  加納由希夫, 鶴岡慶雅
- Organizer
  第22回ゲームプログラミングワークショップ
[Presentation] Parametrized Control in Soccer Simulation with Deep Reinforcement Learning2017
- Author(s)
  Yang, Xu and Tsuruoka, Yoshimasa
- Organizer
  第22回ゲームプログラミングワークショップ

2017 Fiscal Year Annual Research Report

複数の評価手法を利用可能な大規模分散モンテカルロ木探索

Principal Investigator

横山 大作 明治大学, 理工学部, 専任准教授 (80345272)

Current Status of Research Progress

Reason

Research Products

[Journal Article] KDD参加報告2018

Author(s)

Journal Title

[Presentation] Counterfactual Regret Minimization による交渉ゲームの求解2017

Author(s)

Organizer

[Presentation] 内部報酬を自動生成する強化学習による一人用RPGの自動攻略2017

Author(s)

Organizer

[Presentation] Parametrized Control in Soccer Simulation with Deep Reinforcement Learning2017

Author(s)

Organizer

横山大作明治大学, 理工学部, 専任准教授 (80345272)