研究課題/領域番号 |
24500192
|
研究種目 |
基盤研究(C)
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
橋本 剛 松江工業高等専門学校, 情報工学科, 准教授 (40420335)
|
研究期間 (年度) |
2012-04-01 – 2017-03-31
|
キーワード | コンピュータ将棋 / 機械学習 / bonanza method / 棋譜 / 序盤 / 名人 |
研究概要 |
高い終盤力によりコンピュータ将棋の実力はプロに勝つところまで進歩した。だが序盤はまだアマチュアレベルで、名人に勝つためには強い序盤力が必要である。プロは良い「形」の評価ができるが、コンピュータは多くの駒位置パターンからなる「形」を評価できていない。評価関数の機械学習により中盤以降は強くなったが、「形」を理解するプロ並みの序盤を実現するには多くの駒位置からなる評価が必要になる。だが評価要素が増えるとメモリと時間が指数的に増大するため、実現は難しい。本研究では多駒を使った高頻度のパターンを評価させ、かつ実用のために高速化を実現することを目標とし、プロ以上の序盤が実現できるよう工夫をし、名人に勝つコンピュータ将棋の完成を目指している。予備実験により機械学習の高速化が本研究に必要であると判断し、24年度はまず確率的勾配降下法と呼ばれる手法を用いて評価関数学習の高速化を目指した。その結果、すべての候補手、評価要素で学習を行うよりも、ランダムに選んだ局面、手、評価要素で学習を行った方がかなり高速で学習が行えることが確認できた。この結果は平成25年度はじめに発表予定である。次に、24年度は本研究のアウトラインをイメージするためにプロの棋譜からランダムに選んだ数個の駒の配置をカウントし、どのような組み合わせがどの程度の頻度で現れるかを調べた。これも大量のデータを扱う必要があり、どのように実施するか様々な試行錯誤をしているところであるが、一局面から抽出する駒配置組み合わせの個数によっては乱数により意外な組み合わせが上位に来ることがわかった。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
研究アイデアの核は、棋譜からランダムに局面を選び、さらにランダムに駒をn枚選び、選んだ組み合わせで学習パラメータを登録、更新することである。このアイデアを元に設計を行うため、予備実験としてプロの棋譜からランダムに選んだ数個の駒の配置をカウントし、どのような組み合わせがどの程度の頻度で現れるかを調べた。だが、ランダムに選んで組み合わせをメモリに保存していくが、現在用意しているマシンのメモリをフルに使っても乱数によるゆらぎが大きく、上位に現れるには不自然な組み合わせが多くなかなかうまくいかないことがわかった。そのため、設計方法に試行錯誤を繰り返しており、当初24年度に計画していた実装を完了し実験を繰り返すところまではいたっていない。
|
今後の研究の推進方策 |
まずはマシンを何台か購入、もしくは大型計算機を借りてメモリの最大量を増やし、棋譜からランダムに駒を選び妥当な組み合わせが上位に来やすい環境を作るとともに、棋譜から学習項目をランダムに選ぶ仕組みをさらに試行錯誤し、妥当な方法を見つけることを最優先として取り組んでいく。ある程度めどがつけば、本来の計画通り学習を行い実験を繰り返していく。
|
次年度の研究費の使用計画 |
マシンを何台か購入し、本研究の主要アイデア実装実現のために実験を繰り返す。クラスタ環境構築のための通信機材なども購入する。また、本研究を遂行するため東京のコンピュータ将棋研究者の所へ何度か訪問し研究打ち合わせを行うための旅費に充てる。また、コンピュータ将棋など国際大会への参加費用に充てる。
|