2015 Fiscal Year Annual Research Report
タブーサーチを内包したモンテカルロ木探索に基づく囲碁アルゴリズムの研究
Project/Area Number |
25330441
|
Research Institution | Aichi Institute of Technology |
Principal Investigator |
伊藤 雅 愛知工業大学, 情報科学部, 教授 (80221026)
|
Project Period (FY) |
2013-04-01 – 2016-03-31
|
Keywords | コンピュータ囲碁 / モンテカルロ木探索 / プレイアウト / ゾブリストハッシュ / 局面タブーリスト / 逐次更新法 / 一括更新法 / タブーサーチ的手法 |
Outline of Annual Research Achievements |
平成26年度までに達成したタブーリストを内包したモンテカルロ木探索はコンピュータ囲碁における詰碁や9路盤囲碁といった比較的小さな探索空間では有効に機能した。しかし、19路盤囲碁では統計的有意差を獲得するには至らなかった。 平成27年度はこの点の改良に注力した。手のタブーリストへの登録を局面の登録に改めた。登録する局面は、盤面交点への手ではなく、現局面と手の排他的論理和で構成されるゾブリストハッシュを登録するよう改めた。タプーリストに登録・更新するタイミングも、手の登録同様、逐次更新する方法と自分手番で始まるプレイアウトが負けたときのみタブーリストを一括更新する方法の2つを試みた。一括更新法のアイデアはLGRF(Last Good Reply with Forgetting)から着想した。自分手番で始まるプレイアウトが負けた場合、負けた局面をタブーリストに登録して以降のプレイアウトでその局面を禁忌する。これにより負けた局面を避けられるので、直接的ではないが以降のプレイアウトを勝ちに誘導できる。数値実験では、1)19路盤での対局、2)同一局面重複数、3)1回のプレイアウトでタブーになる平均候補手数、これらを評価し提案法は良好な結果を得た。ただ、平均思考時間だけは手をタブーリストに登録する前手法よりも劣る結果となった。ハッシュ処理の計算部分が大きく影響している、と考えられる。 平成27年度は上述した局面タブーリストの提案と検証だけでなく、プレイアウト履歴を短期メモリに保存するタブーサーチ的手法も検討し、9路盤囲碁で対局実験を行った。短期メモリに保存する各プレイアウトの着手手番や攻め合いを計量化して、次の一手を導き出す手法である。予備実験では、GNU Go 3.8 MCTSと100回対戦させ、残念ながら、提案法のタブーサーチ的手法は19勝81敗と大きく負け越す結果となってしまった。
|
Remarks |
平成27年度卒業研究紹介では本研究課題に関連する4件の研究テーマのみを掲載している。 愛知工業大学学術情報リポジトリから論文``局面タブーリストを内包したモンテカルロ木探索の19路盤囲碁への応用''のPDFファイルが取得できる。
|
Research Products
(5 results)