コンピュータ将棋は近年十分に強くなり、一般のアマチュアでは勝てないレベルになっている。これからのコンピュータ将棋は、強さだけでなく対戦して面白いプログラムが求められている。本研究では、トップレベルのプログラムであるBonanzaの評価関数の機械学習の手法を応用して、プレーヤーの棋風を反映した将棋プログラムの作成を目指す。 また、作ったプログラムが実際にプレーヤーの棋風を反映しているのか、対戦して面白いものになっているのかを主観的評価だけでなく、生体信号の測定(視線測定、fNIRS、発汗など)を通して、評価していく。 平成22年度は、棋風に特徴があり、対局数の比較的多い棋士「加藤一二三九段」「谷川浩司九段」「大山康晴十五世名人」などの著名な棋士の棋譜を集め、Bonanzaの学習プログラムを用いて機械学習による評価関数の学習を行ってみた。やはり棋譜の数が少なく、これだけでは相応に強い評価関数の学習に至らなかったので、事前に学習した値を開始パラメータとして、追加で学習していくという形を取った。結果としてはあまり芳しい学習結果が得られなかった。もととした開始パラメータの影響が強すぎたためと考えられる。 また、序盤の戦術については、序盤データベースの学習にこれらの棋譜を用いることで、戦法の選択などで一定の棋風の模倣については効果が見られた。
|