• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2014 Fiscal Year Research-status Report

タブーサーチを内包したモンテカルロ木探索に基づく囲碁アルゴリズムの研究

Research Project

Project/Area Number 25330441
Research InstitutionAichi Institute of Technology

Principal Investigator

伊藤 雅  愛知工業大学, 情報科学部, 教授 (80221026)

Project Period (FY) 2013-04-01 – 2016-03-31
Keywordsコンピュータ囲碁 / 詰碁 / モンテカルロ木探索 / 最良優先探索 / プレイアウト / タブーリスト / 多様性
Outline of Annual Research Achievements

モンテカルロ木探索のすべての葉ノードにプレイアウト初手から数手分のタブーリストを内包させて、候補手をタブーリストに登録する。タブー期間の間、タブーリストに存在する合法手を強制的に禁じ手とすることで候補手多様性を実現した。
2つの数値実験により提案法の優位性を統計的に示した。ひとつは詰碁を対象とした実験であり、もうひとつは詰碁よりも大きい9路盤での対局である。
詰碁では、黒番着手が詰碁問題の最終手順まで辿り着いた回数で正答数を評価した。この正答数をカイ二乗検定を使って統計的に提案法の優位性を示した。
一方の9路盤対局では、オープンソースのGNU Go 3.8に提案法を組み込み、二項検定を使って提案法の有効性を統計的に検証した。
現在、タブーリストに手ではなく、局面を登録する、局面タブーリストを使ったモンテカルロ木探索手法を検討している。基本的にモンテカルロ木探索なので、最良優先探索の挙動をとることに変わりはない。予備実験では良好な結果が得られている。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

タブーリストを内包したモンテカルロ木探索による詰碁と9路盤囲碁への応用までは達成できた。
詰碁では評価の仕方を昨年度から改めた。昨年までは黒先白死の詰碁で黒番初手をもって正答数を評価していた。これを最終手順まで辿りついた回数で正答数を評価するよう改めた。モンテカルロ木探索が一本道の手筋を苦手としている点が克服できているかを検証するためである。
また、9路盤囲碁でも昨年までは生成ノード数を上限に対局させていた。これを上限ノード数ではなく、プレイアウト数の上限で勝率を比較するように改めた。より公平に従来法と比較できるようにするためである。オープンソースへの提案法の組み込みも全面的に書き換えた。プレイアウトにタブーリストを導入することによって候補手多様性を実現でき、結果として好手を見逃がさないようにすることに成功した。
数値計算による提案法の優位性検証だけでなく、タブーリスト導入に伴う解析的なオーバーヘッドの算出も仮定から見直した。昨年まではタブーリストに登録済みの手が出現した時点でプレイアウトを初手からやり直すと仮定して、無駄になる候補手数の平均を近似的に算出していた。これをその手のみ破棄すると仮定して、無駄になる平均候補手数の上界を求めるように式展開を改めた。結果は、候補手多様性確保のために1回のプレイアウト中に高々平均5~7手を余分に生成するだけで済むことが判明した。
このように昨年度から細かい修正を多数行った結果、肝心のタブーサーチ導入への取り組みが遅れる結果となった。

Strategy for Future Research Activity

タブーリストを内包したモンテカルロ木探索による9路盤囲碁への応用までしか完成していない。19路盤囲碁では従来法の改善に完全に失敗している。探索空間の大きさを克服できていないのが原因であると考えられる。
これを打破する一つの方策が局面タブーリストを使ったモンテカルロ木探索手法である。モンテカルロ木探索なのでやはり最良優先探索の枠組みからは脱却できない。しかしまず、これを実装して数値実験で定量的に局面タブーリストの有効性を評価したい。
次なるステップはやはり、タブーサーチの導入である。タブーリストだけでは候補手探索をモンテカルロ木による木探索に頼るしかない。最良優先探索なのである程度は効率的であるが、一番の問題はプレイアウトの履歴を全く使っていないことである。つまり、大量のプレイアウト生成で無駄に時間を費やしている。勝ったプレイアウトの履歴も負けたプレイアウトの履歴も有効に利用して次の一手を探索したい。そのためには様々な属性をもつ複数の短期タブーリストと長期タブーリストを組み合わせて、モンテカルロ木探索と同程度の性能を有するタブーサーチ手法による囲碁アルゴリズムを構築するしかない。
数値実験でいろいろと模索はしているが、結果は芳しくない。もし成功して上手くいけば並列化も視野にいれたい。

Causes of Carryover

次年度使用額(繰越し額)142,770円が生じた理由を記す。
平成26年4月7日付けで論文初稿を電気学会C分冊に投稿した。採録までに2回、論文を再提出した。論文の手直しだけでなく、数値計算のやり直しやそれに付随するプログラムの改良に多大な時間を費やした。
結果、研究の進捗に大幅な遅れが生じ、以降のプログラム開発、学会発表ならびに論文作成ができなかった。その影響で予算計上してあった旅費等の予算が適切に使用できなかった。これが次年度使用額が生じた主たる理由である。

Expenditure Plan for Carryover Budget

繰越し額については、次年度も引き続き本研究課題に取り組むため、進捗状況にもよるが、記憶媒体やトナーカートリッジ等の消耗品費と旅費に充当する予定である。

Remarks

本研究課題に関連する5つの研究のテーマのみを掲載している。

  • Research Products

    (4 results)

All 2015 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results,  Acknowledgement Compliant: 1 results) Presentation (2 results) Remarks (1 results)

  • [Journal Article] タブーリストを内包したモンテカルロ木探索の詰碁と9路盤囲碁への応用2015

    • Author(s)
      太田雄大,伊藤雅
    • Journal Title

      電気学会論文誌C

      Volume: 135 Pages: 331-339

    • DOI

      10.1541/ieejeiss.135.331

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] 局面タブーリストを内包したモンテカルロ木探索手法2015

    • Author(s)
      太田雄大,伊藤雅
    • Organizer
      情報処理学会第77回全国大会
    • Place of Presentation
      京都大学吉田キャンパス(京都府京都市)
    • Year and Date
      2015-03-17 – 2015-03-19
  • [Presentation] 短期メモリによるタブーサーチを用いた囲碁アルゴリズムの構築2015

    • Author(s)
      川合諒,伊藤雅
    • Organizer
      平成26年度日本経営工学会中部支部研究発表会
    • Place of Presentation
      名古屋工業大学(愛知県名古屋市)
    • Year and Date
      2015-02-26 – 2015-02-26
  • [Remarks] 平成26年度 修士論文・卒業研究紹介

    • URL

      http://aitech.ac.jp/~milabo/member/k20/

URL: 

Published: 2016-05-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi