コンピュータ囲碁の主流はモンテカルロ木探索である。この手法は一手の探索に約1万回のプレイアウトを実施する必要がある。プレイアウトとは現局面からランダムに石を打って終局させることである。プレイアウトの精度が上がれば、少ないプレイアウト数で正確に探索木を成長させられる。しかしこれが意外に難しい。 本研究では、プレイアウトに正確性でなく、多様性を持たせて、より多くの局面を試行することを提案した。探索木が深さ方向に成長するのを抑制し、代わりに木が均一的に成長するのを促進する。これを実現するためにプレイアウトにタブーリストの導入を試みた。タブーリストとはタブーサーチで利用される短期メモリのことである。
|