研究課題/領域番号 |
25330441
|
研究機関 | 愛知工業大学 |
研究代表者 |
伊藤 雅 愛知工業大学, 情報科学部, 教授 (80221026)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | コンピュータ囲碁 / 詰碁 / モンテカルロ木探索 / 最良優先探索 / プレイアウト / タブーリスト / 多様性 |
研究実績の概要 |
モンテカルロ木探索のすべての葉ノードにプレイアウト初手から数手分のタブーリストを内包させて、候補手をタブーリストに登録する。タブー期間の間、タブーリストに存在する合法手を強制的に禁じ手とすることで候補手多様性を実現した。 2つの数値実験により提案法の優位性を統計的に示した。ひとつは詰碁を対象とした実験であり、もうひとつは詰碁よりも大きい9路盤での対局である。 詰碁では、黒番着手が詰碁問題の最終手順まで辿り着いた回数で正答数を評価した。この正答数をカイ二乗検定を使って統計的に提案法の優位性を示した。 一方の9路盤対局では、オープンソースのGNU Go 3.8に提案法を組み込み、二項検定を使って提案法の有効性を統計的に検証した。 現在、タブーリストに手ではなく、局面を登録する、局面タブーリストを使ったモンテカルロ木探索手法を検討している。基本的にモンテカルロ木探索なので、最良優先探索の挙動をとることに変わりはない。予備実験では良好な結果が得られている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
タブーリストを内包したモンテカルロ木探索による詰碁と9路盤囲碁への応用までは達成できた。 詰碁では評価の仕方を昨年度から改めた。昨年までは黒先白死の詰碁で黒番初手をもって正答数を評価していた。これを最終手順まで辿りついた回数で正答数を評価するよう改めた。モンテカルロ木探索が一本道の手筋を苦手としている点が克服できているかを検証するためである。 また、9路盤囲碁でも昨年までは生成ノード数を上限に対局させていた。これを上限ノード数ではなく、プレイアウト数の上限で勝率を比較するように改めた。より公平に従来法と比較できるようにするためである。オープンソースへの提案法の組み込みも全面的に書き換えた。プレイアウトにタブーリストを導入することによって候補手多様性を実現でき、結果として好手を見逃がさないようにすることに成功した。 数値計算による提案法の優位性検証だけでなく、タブーリスト導入に伴う解析的なオーバーヘッドの算出も仮定から見直した。昨年まではタブーリストに登録済みの手が出現した時点でプレイアウトを初手からやり直すと仮定して、無駄になる候補手数の平均を近似的に算出していた。これをその手のみ破棄すると仮定して、無駄になる平均候補手数の上界を求めるように式展開を改めた。結果は、候補手多様性確保のために1回のプレイアウト中に高々平均5~7手を余分に生成するだけで済むことが判明した。 このように昨年度から細かい修正を多数行った結果、肝心のタブーサーチ導入への取り組みが遅れる結果となった。
|
今後の研究の推進方策 |
タブーリストを内包したモンテカルロ木探索による9路盤囲碁への応用までしか完成していない。19路盤囲碁では従来法の改善に完全に失敗している。探索空間の大きさを克服できていないのが原因であると考えられる。 これを打破する一つの方策が局面タブーリストを使ったモンテカルロ木探索手法である。モンテカルロ木探索なのでやはり最良優先探索の枠組みからは脱却できない。しかしまず、これを実装して数値実験で定量的に局面タブーリストの有効性を評価したい。 次なるステップはやはり、タブーサーチの導入である。タブーリストだけでは候補手探索をモンテカルロ木による木探索に頼るしかない。最良優先探索なのである程度は効率的であるが、一番の問題はプレイアウトの履歴を全く使っていないことである。つまり、大量のプレイアウト生成で無駄に時間を費やしている。勝ったプレイアウトの履歴も負けたプレイアウトの履歴も有効に利用して次の一手を探索したい。そのためには様々な属性をもつ複数の短期タブーリストと長期タブーリストを組み合わせて、モンテカルロ木探索と同程度の性能を有するタブーサーチ手法による囲碁アルゴリズムを構築するしかない。 数値実験でいろいろと模索はしているが、結果は芳しくない。もし成功して上手くいけば並列化も視野にいれたい。
|
次年度使用額が生じた理由 |
次年度使用額(繰越し額)142,770円が生じた理由を記す。 平成26年4月7日付けで論文初稿を電気学会C分冊に投稿した。採録までに2回、論文を再提出した。論文の手直しだけでなく、数値計算のやり直しやそれに付随するプログラムの改良に多大な時間を費やした。 結果、研究の進捗に大幅な遅れが生じ、以降のプログラム開発、学会発表ならびに論文作成ができなかった。その影響で予算計上してあった旅費等の予算が適切に使用できなかった。これが次年度使用額が生じた主たる理由である。
|
次年度使用額の使用計画 |
繰越し額については、次年度も引き続き本研究課題に取り組むため、進捗状況にもよるが、記憶媒体やトナーカートリッジ等の消耗品費と旅費に充当する予定である。
|
備考 |
本研究課題に関連する5つの研究のテーマのみを掲載している。
|