研究課題/領域番号 |
19K12719
|
研究機関 | 県立広島大学 |
研究代表者 |
佐々木 宣介 県立広島大学, 経営情報学部, 准教授 (20326424)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 大将棋類 / 自動プレイ / 中将棋 / 機械学習 |
研究実績の概要 |
本研究で対象としている大きな盤と多数の駒でプレイされる大将棋類のルール評価について、これまでは主に「中将棋」という変種について、計算機実験の信頼性向上のため、機械学習手法の改良を目指し、機械学習手法の調査および計算機実験プログラムの開発と評価を目指している。 過去に行ってきた大将棋類のゲームのデータを採取する自動プレイ実験の実施にあたり、中将棋については、機械学習手法の一種であるTD(Temporal Difference)学習法によって駒の価値のみを学習するプログラムを作成して駒価値を学習し、駒価値のみを評価関数とする思考アルゴリズムのプログラムを用いた計算機実験を行ってきた。この自動プレイ実験で得られるデータは、ランダムに近い弱いプログラムであり、それよりも強いプログラムを用いる方が信頼性の高いデータを得られると考えられる。そのため、本申請においては、駒価値を評価するプログラムよりもさらに強い大将棋類の思考プログラムを実現するために、機械学習手法の改善を図ることとしている。 今年度は、前年度に引き続き、通常の将棋プログラムの機械学習において近年成果を上げている学習手法の調査および、その手法を参考にした中将棋プログラムの開発を実施してきた。当初は大きな盤の変種を中心に実施する予定であった。しかし、通常の将棋と比較して大きな盤面と多数の駒を用いているため、機械学習の実験実施や、その後の計算機実験の実施においても一定の時間が必要となる。そのため、機械学習手法の性能比較の段階でも、かなり時間を要している状況である。そこで、平行して、過去にルールの評価を行ってきた小さい盤の将棋も含めた実験を通じて学習方法の比較も実施している。 そのため、現時点では中将棋を含めた大将棋類の実験においても、まだ機械学習プログラムの開発と、その性能評価の段階となっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本研究の研究対象としている大きな盤と多数の駒でプレイされる大将棋類の中で、「中将棋」という変種についての機械学習および自動プレイ実験を行うプログラム開発を進めてきたが、現時点では、まだその成果は十分とは言えない段階である。計算機実験用プログラム開発に要する時間の他、計算機実験の実施には一定の時間が必要であることから、適用した強化学習手法の学習結果の性能評価および、プログラムの改善等に当初の予定よりも多くの時間がかかっている。大将棋類は大きな盤と多数の駒でプレイされるため、通常の将棋プログラムよりも計算機実験に多くの時間を要することもその要因である。そのため、現時点ではまだ中将棋の強化学習を行うプログラム開発とその性能評価を継続している段階となっており、学習後に中将棋のゲームデータを採取してルール評価の実施、中将棋以外の種類の大将棋類への機械学習手法の適用等の段階には、まだ至っていない状況である。 また、複数のタイプの学習手法の性能を確かめるため、通常の将棋プログラムで主流となっているNNUE評価関数を利用する手法、Deep Learningを利用する手法のそれぞれ評価を行うこととしたため、さらに時間がかかっている要因となっている。
|
今後の研究の推進方策 |
本研究で対象とする大将棋類の変種の中では、「中将棋」の機械学習を行うプログラムの開発と評価を優先的に実施していく。それを通じて中将棋をはじめとする大将棋類でも有効に動作すると考えられる機械学習手法について、検討および実験評価を行うこととする。その一方で、大将棋類における実験は、非常に時間がかかるため、大将棋類における実験評価と並行して、これまでの研究で実施していたような小将棋類の変種に対しての実験も行っていくこととする。適用する学習手法としては、現在、通常の将棋プログラムで主に利用されている2種の学習手法である、NNUE評価関数を利用する手法、Deep Learningを利用する手法、の両方について実験を行っていくこととする。 これらの実験を通じて、中将棋における機械学習を有効に動作させる手法の確認を行い、その後、自動プレイ実験による中将棋のゲームデータの採取を行い、本研究の最終目標である、ゲームのルール評価を行っていく。また、それと並行して、「大将棋」等の中将棋以外の大将棋類におけるプログラム開発も実施していく予定である。
|
次年度使用額が生じた理由 |
新型コロナウイルスの影響により、予定していた学会出張等は全て取りやめになった。一定の金額については、高速に計算を行う計算機の機材及び周辺機器の購入費用として活用した。次年度使用額については、計算機の周辺機器の購入費用、論文投稿・掲載費用として使用する予定である。
|