研究課題/領域番号 |
24500192
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
橋本 剛 松江工業高等専門学校, 情報工学科, 准教授 (40420335)
|
研究期間 (年度) |
2012-04-01 – 2018-03-31
|
キーワード | コンピュータ将棋 / 評価関数 / Bonanza Method / 機械学習 / freq型 |
研究実績の概要 |
本研究ではコンピュータ将棋にプロ級の良い「形」を評価させることを目指し、「乱数を用いる評価項目自動抽出法」を提案し、多くの駒位置からなる評価要素を乱数を使い自動で抽出することに成功し成果を収めた。実用に向けては提案手法の探索時間削減への取り組みが必要となるので、この数年間いくつかのアイデアを提案し実装を繰り返してきた。高速化を目指して木構造ではない新しいデータ構造評価値参照の差分計算方法を考案したが、その実装のため駒組み合わせ参照の新しい仕組みが必要となった。その高速化のため、今年度は駒組み合わせのインデックスリストを保持し、参照を高速化する手法を提案した。学習された駒組み合わせを実戦で評価する際、従来は駒組み合わせすべてを参照する必要があったが、提案手法により殆どの場合一駒の参照で済ますことが可能になり、高速化が実現できた。提案手法による性能を評価するため、多くの実験を行った。まずは盤上の3駒組み合わせより上位約10,000要素を従来の評価関数に加えて、計算時間の測定と自己対局による勝率の比較を行った。その結果、従来の実装より大幅な高速化を実現し勝率も高くなったが、実用にはまだ高速化が必要なこともわかった。 また、プロ棋譜に現れる3駒組み合わせをランダムに抽出したことにより、どのような組み合わせが多く現れるかのデータが明らかになった。組み合わせ上位は桂や香などを含む、初期配置と差があまりないものが多かった。組み合わせ中位には、矢倉や美濃囲いなど頻出する囲いに関する要素が多く見られた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
4: 遅れている
理由
提案した「乱数を用いる評価項目自動抽出法」の実用化を目指し、さまざまな高速化手法を提案、実装し実験を繰り返してきた。当初の実装よりは大幅な高速化を実現できたが、当初の見積もりより計算時間が相当必要なことがわかり、想定よりはずっと実用化が難しいことがわかってきた。研究期間での実用化を目指しているがさらなる工夫が必要で、予定よりも遅れている。
|
今後の研究の推進方策 |
これまでの実装方針では計算速度の問題で実用化が難しいことがわかったので、提案した「乱数を用いる評価項目自動抽出法」のアイデアを使い深層学習による評価関数計算に使うことを検討する。近年、将棋で深層学習を使う研究が報告されているが、学習資源を大量に使い時間がかかることが問題となっている。このアイデアを使うことで頻度の高い要素だけを高速に学習できる可能性があるので、成功すれば将棋に限らず幾つかのゲームAIで試していく。
|
次年度使用額が生じた理由 |
提案手法の実用化を目指して工夫を重ねてきたが、実際に開発をして、当初の見積もりより計算時間が多く必要で、実用化が難しいことがわかり、当初の予定より遅れている。そのため、予定期間を過ぎても実装、実験を繰り返しており、さらに1年延長して研究を行うために一年遅らせることにした。
|
次年度使用額の使用計画 |
最後に研究をまとめ、学会で発表をするための旅費として使う予定である。
|