2012 Fiscal Year Research-status Report

名人を超える将棋序盤アルゴリズムの開発

Research Project

Project/Area Number	24500192
Research Category	Grant-in-Aid for Scientific Research (C)
Research Institution	Matsue National College of Technology
Principal Investigator	橋本剛松江工業高等専門学校, 情報工学科, 准教授 (40420335)
Project Period (FY)	2012-04-01 – 2017-03-31
Keywords	コンピュータ将棋 / 機械学習 / bonanza method / 棋譜 / 序盤 / 名人
Research Abstract	高い終盤力によりコンピュータ将棋の実力はプロに勝つところまで進歩した。だが序盤はまだアマチュアレベルで、名人に勝つためには強い序盤力が必要である。プロは良い「形」の評価ができるが、コンピュータは多くの駒位置パターンからなる「形」を評価できていない。評価関数の機械学習により中盤以降は強くなったが、「形」を理解するプロ並みの序盤を実現するには多くの駒位置からなる評価が必要になる。だが評価要素が増えるとメモリと時間が指数的に増大するため、実現は難しい。本研究では多駒を使った高頻度のパターンを評価させ、かつ実用のために高速化を実現することを目標とし、プロ以上の序盤が実現できるよう工夫をし、名人に勝つコンピュータ将棋の完成を目指している。予備実験により機械学習の高速化が本研究に必要であると判断し、２４年度はまず確率的勾配降下法と呼ばれる手法を用いて評価関数学習の高速化を目指した。その結果、すべての候補手、評価要素で学習を行うよりも、ランダムに選んだ局面、手、評価要素で学習を行った方がかなり高速で学習が行えることが確認できた。この結果は平成２５年度はじめに発表予定である。次に、２４年度は本研究のアウトラインをイメージするためにプロの棋譜からランダムに選んだ数個の駒の配置をカウントし、どのような組み合わせがどの程度の頻度で現れるかを調べた。これも大量のデータを扱う必要があり、どのように実施するか様々な試行錯誤をしているところであるが、一局面から抽出する駒配置組み合わせの個数によっては乱数により意外な組み合わせが上位に来ることがわかった。
Current Status of Research Progress	Current Status of Research Progress 3: Progress in research has been slightly delayed. Reason 研究アイデアの核は、棋譜からランダムに局面を選び、さらにランダムに駒をn枚選び、選んだ組み合わせで学習パラメータを登録、更新することである。このアイデアを元に設計を行うため、予備実験としてプロの棋譜からランダムに選んだ数個の駒の配置をカウントし、どのような組み合わせがどの程度の頻度で現れるかを調べた。だが、ランダムに選んで組み合わせをメモリに保存していくが、現在用意しているマシンのメモリをフルに使っても乱数によるゆらぎが大きく、上位に現れるには不自然な組み合わせが多くなかなかうまくいかないことがわかった。そのため、設計方法に試行錯誤を繰り返しており、当初２４年度に計画していた実装を完了し実験を繰り返すところまではいたっていない。
Strategy for Future Research Activity	まずはマシンを何台か購入、もしくは大型計算機を借りてメモリの最大量を増やし、棋譜からランダムに駒を選び妥当な組み合わせが上位に来やすい環境を作るとともに、棋譜から学習項目をランダムに選ぶ仕組みをさらに試行錯誤し、妥当な方法を見つけることを最優先として取り組んでいく。ある程度めどがつけば、本来の計画通り学習を行い実験を繰り返していく。
Expenditure Plans for the Next FY Research Funding	マシンを何台か購入し、本研究の主要アイデア実装実現のために実験を繰り返す。クラスタ環境構築のための通信機材なども購入する。また、本研究を遂行するため東京のコンピュータ将棋研究者の所へ何度か訪問し研究打ち合わせを行うための旅費に充てる。また、コンピュータ将棋など国際大会への参加費用に充てる。