現実世界の大規模な探索問題は全解探索は困難であり、有用そうな部分を選択的に探索するアルゴリズムが用いられる。ゲーム木の探索はこのような問題の一例であり、近年提案されたモンテカルロ木探索がその有効性から広まっているが、将棋など「細い正解の一本道をたどらねばならない」ような問題領域においては収束が遅く、適用が難しい。我々は、局面評価値の確率分布をゲーム木でそのまま扱えるベイジアンアプローチに基づいた探索アルゴリズムを提案し、将棋での有効性を確認しつつあるが、並列計算手法が未検討であり、大規模問題を解くうえでの障害となっている。本年度は、前年度までに行ったアルゴリズムの詳細設計、及び性能評価用実装による性能面での検討成果をもとに、実用性を考慮したシステム実装を行い、評価を行った。 また、提案手法の応用分野の拡大を図るため、多人数不完全情報ゲームなどのコンピュータプレイヤの構築と機械学習の適用、特に強化学習の適用に関する研究を行い、それぞれの研究成果を研究会において論文発表した。これらのゲームプレイヤに関する知見はそのままでは現在のモンテカルロ木探索手法に適用できるものではないが、今回の研究でターゲットとしている将棋プレイヤの実用性を向上させるための基礎研究として役立てられた。また、これらの問題領域へアプローチできるよう、今回の研究内容を発展させる際の方針の明確化、並びに課題の確認を行うことができた。
|