研究課題/領域番号 |
25330441
|
研究種目 |
基盤研究(C)
|
研究機関 | 愛知工業大学 |
研究代表者 |
伊藤 雅 愛知工業大学, 情報科学部, 教授 (80221026)
|
研究期間 (年度) |
2013-04-01 – 2016-03-31
|
キーワード | コンピュータ囲碁 / 詰碁 / モンテカルロ木探索 / プレイアウト / タブーリスト / 多様性 / 幅優先探索 |
研究概要 |
交付申請書の研究目的(概要)で 1) 定石・手筋を考慮したモンテカルロ木探索を提案し、2) さらに禁忌表を使ったタブーサーチを内包させることで棋力の向上を図る、と記した。これら2つの視点から研究実績の概要をまとめる。 まず、研究目的の1つ目は、オープンソース・ソフトウェアであるGNU Go 3.8 (gnugo)を改良することで実現した。gnugoは9路盤までしかモンテカルロ木探索を導入できていないが、これを19路盤で動作するように改良した。定石・手筋はgnugoオリジナルから変更していないが、この部分の解析と改良はこれから行う予定である。19路盤に拡張してコミを6目半にして1,000局ほどgoguiを使って自動対戦させた。理由は不明であるが、先手の方が勝率が高く、後手が明らかに不利になることが判明した。原因はこれから究明する。 次に、研究目的の2つ目であるが、これはタブーサーチで主要な役割を果たすタブーリストをモンテカルロ木のすべての葉ノードに導入することで部分的ではあるが実現した。ただ、現状ではタブーサーチの導入までには至っていない。タブーサーチの解の多様性を本囲碁の研究では候補手の多様性と捉え直している。 候補手多様性の優位を検証するために詰碁で数値実験を行った。モンテカルロ木探索オリジナルとモンテカルロ木探索にタブーリストを内包させた提案法で詰碁の正答率を比較した。結果は概ね良好であった。 gunugoソースにタブーリストを内包させた19路盤の提案法アルゴリズムを実装して平成26年3月に電気通信大学で開催された第7回UEC杯コンピュータ囲碁大会にカテゴリC枠で出場した。対戦成績は7戦して3勝4敗であった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
オープンソース・ソフトウェアのGNU Go 3.8のモンテカルロ木探索部分に関するリバースエンジニアリングは順調に進み、タブーリストを組み込むことには一応、成功した。 タブーリストを盤面初手から数手目までに組み込むことにも成功した。数値実験の結果、初手から第5手目までにタブーリストを導入すれば十分であることを確認した。詰碁では探索空間が狭いため必要ないが、対戦ではタブーサイズの短縮が勝率改善に寄与することが数値実験から明らかになった。 タブーリストの役割は、組合せ最適化問題では解の多様性確保に役立つことが分かっている。囲碁ではタブーリストに登録された手が禁じ手扱いとなるため、やはり候補手多様性につながり、有力候補手を見逃さないようになる。結果的に、これが棋力の向上をもたらす結果となっている。 詰碁は9路盤や19路盤の対戦とは異なり探索空間が比較的狭い。よって相手初手と自分次手の2手だけにタブーリストを導入するだけでも比較的良好な結果が得られた。タブーサイズの短縮スケジュールも必要ない。せいぜい初手から数手で決着がつくからである。数値計算では、詰碁の先手黒番初手が正着であるか否かを正答の基準とした。 N路盤で第M手目までにタブーサイズLのタブーリストを導入するとき、無駄になる平均候補手数は高々6手程度であることを解析的に計算することができた。このことは、提案法は従来法に比べ余分な手続きを必要とする一方で、そのオーバーヘッドは極めて小さいことを意味している。数値計算結果からもこの事実を確認している。研究室での数値実験結果だけでなく、初のコンピュータ囲碁大会に参戦して3勝した。この対戦結果から提案法の有効性を十分検証できた、と自負している。
|
今後の研究の推進方策 |
初年度に達成した研究内容はタブーリストを内包したモンテカルロ木探索の提案までである。ここまでは一応成功した。しかしタブーリストをタブーサーチという一般的なモダンヒューリスティクスにまで進展させるところが未完となっている。ここを克服することが非常に難しいことが徐々に判明してきた。かなりの時間と労力が必要となるであろう。 現在、提案法をGNU Go 3.8に組み込んで9路盤や19路盤で提案法の優位性を単一コアにて検証している。GNU Goはモンテカルロ木探索だけからなるオープンソースではない。コンピュータ囲碁の思考ルーチンとしての完成度も高い。コンピュータ囲碁プロトコルのひとつであるGTP (Go Text Protocol)もGNU Goに実装されている。GTPの解析が急務である。GTPの解析を急ぐ理由は2つある。ひとつは大量のデータ取得にGoGuiの自動対戦を使いたい。もうひとつは囲碁の思考ルーチン同士のネットワーク対戦を実現するためである。 モンテカルロ木探索以外について囲碁プログラム全体をリバースエンジニアリングすることは研究計画調書作成時には予定していなかった。ソースの解析は研究の進捗が遅れる要因にもなりかねない。しかし、布石・定石・手筋といった打ち手を完全にオリジナルで達成するよりは先人のプログラムを解析して、それを改良した方が効果的かつ効率的であるという結論に至った。 ここまでを平成26年度以内に完成させて、その上で条件を細かく設定して、その一手が勝敗あるいは勝率にどれほど寄与しているかを統計的に明らかにする。勝敗あるいは勝率に一番寄与している部分が発見できれば、その部分に並列化を施し、マルチコアによる高速化と思考ルーチンの棋力強化を実現できる。
|
次年度の研究費の使用計画 |
次年度使用額(繰越し額)32,280円が生じた理由は、本研究課題を遂行する上で必要となった図書購入費および記憶媒体等の消耗品費を大学から支給される個人研究費でその購入費用の一部を賄ったからである。 繰越し額については次年度も引き続き本研究課題に取り組むため、主としてトナーカートリッジ等の消耗品費に充当する予定である。
|