研究課題/領域番号 |
24500192
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
橋本 剛 松江工業高等専門学校, 情報工学科, 准教授 (40420335)
|
キーワード | コンピュータ将棋 / 評価関数 / Bonanza Method / 機械学習 / freq型 |
研究概要 |
本研究ではコンピュータ将棋の序盤をプロレベルにすることを目指して、プロ並みの良い「形」の評価をさせることを目指す。「形」を理解するプロ並みの序盤を実現するには多くの駒位置からなる評価が必要になるが、評価要素が増えるとメモリと時間が指数的に増大するため、現在コンピュータ将棋でよく行われているように駒組み合わせをすべて評価する方法(all型と呼ぶ)では実現し難い。この問題を解決するには、無駄な組み合わせを排除し重要な組み合わせのみを評価する方法(freq型と呼ぶ)が必要である。現在では、freq型を手動で設定しているプログラムはあるが、有効な自動獲得法は提案されていない。 そこで本研究では乱数を用いた駒組み合わせの出現頻度カウントによる評価項目の抽出法を提案する。 まず,出現頻度を調べるために対局中に現れる駒組み合わせの出現回数をカウントした。全ての組み合わせをカウントすることは不可能なため,カウントする組み合わせはランダムに選択した。選ばれた駒組み合わせを分析した所、ほとんど動くことがない香や桂馬などの組み合わせがカウント回数上位となり、囲いなどに現れる駒の組み合わせはカウント回数中位に多く現れた。 次に実際に抽出された項目を用いてfreq型評価関数をBonanzaに実装し、all型のみのプログラムと対戦実験を行った。その結果、探索時間は多く必要としたものの、王と他の1駒を評価するプログラムには大きく勝ち越しその有用性を示すことが出来た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究目的で述べた、コンピュータ将棋における、乱数を使った高出現頻度の駒組み合わせ評価関数のアイデアを整理し、実際に実装することが出来た。また、実装したものを学習して対戦実験を行うことも出来、初期段階としてその有用性を示すことが出来た。
|
今後の研究の推進方策 |
実装はかなり進んだので、今後はまず評価関数の差分計算を導入するなど計算の無駄をなくす事に注力し、同等の時間配分で提案手法が優位性を示すより実用的なプログラムを完成させる。また、とりあえず3駒間の高頻度駒組み合わせによる評価関数の実装に成功したが、より時間のかかる4駒以上の高頻度駒組み合わせ評価関数を実用レベルで使用できるようなアイデアを考え、実装を行う。
|
次年度の研究費の使用計画 |
機械学習の性能評価実験に多くのPCが必要であるが、次年度以降により多く実験が必要であり、次年度発売予定のintel CPU(8期のCPUコアとDDR4メモリコントローラを持つ)を搭載するマシンを購入すると、評価関数の機械学習がかなり効率よく行える。よって新世代CPU搭載マシンの発売を待ってPCを購入して大量に実験を行う方が良いと判断した。 新型CPUを搭載できるPCが販売されれば、その値段に応じてPCを複数台購入する予定である。おおよそ1台25万円程度であると予想しており、その場合は3台は購入したい。購入後は機械学習計算にあて、実装が完成すればクラウドサーバーとしても使用したい。
|