2016 Fiscal Year Research-status Report
戦略的な投票行動による合議アルゴリズムを用いた囲碁プログラムの効率化
Project/Area Number |
16K00505
|
Research Institution | Chiba Institute of Technology |
Principal Investigator |
前川 仁孝 千葉工業大学, 情報科学部, 教授 (90267419)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | 囲碁 / 人工知能 / ゲームプログラミング / 合議アルゴリズム / モンテカルロ木探索 |
Outline of Annual Research Achievements |
本研究課題は、合議アルゴリズムを用いた強い囲碁プログラムを作成するために、合議を行う思考プログラムに戦略的な投票行動を組み込むことを目的とする。思考プログラムが戦略的な投票行動を行うことで合議で選択されることのない着手に対する思考時間を削減できるため、囲碁プログラムの勝率が向上すると考えられる。平成28年度は、まず、研究実施計画に則り、合議を行う囲碁プログラムと戦略的な投票行動を行う思考プログラムを作成した。思考プログラムには、オープンソースの囲碁プログラムfuegoを利用した。ただし、戦略的な投票行動の細かなチューニングに関しては、平成29年度以降の計画となっている。このため,平成28年度は、直前の手番に自身が投票した着手が多数決で多数派に属しているか少数派に属しているかの情報のみで戦略的投票の判定を行うプログラムを作成した。さらに、戦略的な投票行動を行う思考プログラムによる合議プログラムと、そうでない思考プログラムによる合議プログラムとで対局を行い、戦略的な投票行動の有効性を明らかにした。 また、平成29年度以降にモンテカルロ木探索の効率化手法に対して戦略的な投票行動を組み込むことになっているが、平成28年度はその一部に対して検討を行った。fuegoのようにモンテカルロ木探索を行う思考プログラムに有効な探索戦略として、LGRF(Last Good Reply with Forget)が知られている。LGRFは、平成29年度以降に戦略的な投票行動を組み込む効率化手法のひとつとして考えられる。一方で、本来のfuegoにはLGRFの手続きが含まれていない。このため平成28年度は、予備評価を上記のプログラム作成と並行して行い、合議を行わない本来のfuegoに対してLGRFを用いる有効性を評価した。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
評価に利用するために平成29年度に購入する予定であった計算機が製造中止となったため、同計算機の平成29年度中の購入は難しいと判断して急遽平成28年度に購入した。これに伴い、年度の途中で予算の組み替えが必要となったため、研究計画にあったプログラム実装や、評価実験の統計処理や分析を行う時間を減らし進捗を遅らせることで当初の予定より謝金を減らした。このため研究の進捗が多少遅れている。
|
Strategy for Future Research Activity |
平成29年度以降は、研究実施計画に則り、戦略的な投票行動を行う囲碁プログラムに関する評価を引き続き行う。さらに、戦略的な投票行動を行うプログラムに統計処理を加えることで、勝率にどのような影響を与えるか評価する。また、平成28年度の研究成果を踏まえ、研究実施計画に記載した手法だけでなくLGRFに対しても戦略的な投票行動の有効性を検討する予定である。
|
Causes of Carryover |
平成29年度に購入を予定していた評価用の計算機の製造中止に伴い、平成28年度に同計算機を急遽購入する必要が生じた。このままだと予算が不足するため、研究の到達目標を変更することで、人件費・謝金の支出を抑えるよう予算を組み替えた。この際、予定より多く人件費・謝金の支出が減ったことにより次年度使用額が生じた。
|
Expenditure Plan for Carryover Budget |
次年度使用額は、進捗を遅らせた分を取り戻すために謝金として利用する予定である。
|