2016 Fiscal Year Annual Research Report
Large scale distributed monte-carlo game-tree search based on probability distribution
Project/Area Number |
26280130
|
Research Institution | The University of Tokyo |
Principal Investigator |
横山 大作 東京大学, 生産技術研究所, 助教 (80345272)
|
Project Period (FY) |
2014-04-01 – 2017-03-31
|
Keywords | 人工知能 / アルゴリズム / ゲーム情報学 |
Outline of Annual Research Achievements |
現実世界の大規模な探索問題は全解探索は困難であり、有用そうな部分を選択的に探索するアルゴリズムが用いられる。ゲーム木の探索はこのような問題の一例であり、近年提案されたモンテカルロ木探索がその有効性から広まっているが、将棋など「細い正解の一本道をたどらねばならない」ような問題領域においては収束が遅く、適用が難しい。我々は、局面評価値の確率分布をゲーム木でそのまま扱えるベイジアンアプローチに基づいた探索アルゴリズムを提案し、将棋での有効性を確認しつつあるが、並列計算手法が未検討であり、大規模問題を解くうえでの障害となっている。本年度は、前年度までに行ったアルゴリズムの詳細設計、及び性能評価用実装による性能面での検討成果をもとに、実用性を考慮したシステム実装を行い、評価を行った。 また、提案手法の応用分野の拡大を図るため、多人数不完全情報ゲームなどのコンピュータプレイヤの構築と機械学習の適用、特に強化学習の適用に関する研究を行い、それぞれの研究成果を研究会において論文発表した。これらのゲームプレイヤに関する知見はそのままでは現在のモンテカルロ木探索手法に適用できるものではないが、今回の研究でターゲットとしている将棋プレイヤの実用性を向上させるための基礎研究として役立てられた。また、これらの問題領域へアプローチできるよう、今回の研究内容を発展させる際の方針の明確化、並びに課題の確認を行うことができた。
|
Research Progress Status |
28年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
28年度が最終年度であるため、記入しない。
|
Causes of Carryover |
28年度が最終年度であるため、記入しない。
|
Expenditure Plan for Carryover Budget |
28年度が最終年度であるため、記入しない。
|