研究課題/領域番号 |
19K12719
|
研究機関 | 県立広島大学 |
研究代表者 |
佐々木 宣介 県立広島大学, 経営情報学部, 准教授 (20326424)
|
研究期間 (年度) |
2019-04-01 – 2022-03-31
|
キーワード | 大将棋類 / 自動プレイ / 中将棋 / 機械学習 |
研究実績の概要 |
本研究で対象としている大きな盤と多数の駒でプレイされる大将棋類のうち、これまでは主に「中将棋」という変種について、計算機実験の信頼性向上のため、機械学習手法の改良を目指し、調査および計算機実験プログラムの開発と評価を行っている。 過去に行ってきた中将棋のゲームデータ採取を行う自動プレイ実験では、機械学習手法の一種であるTD(Temporal Difference)学習法によって駒の価値のみを学習するプログラムを作成して駒価値を学習し、駒価値のみを評価関数とする思考アルゴリズムのプログラムを用いた計算機実験を行ってきた。この自動プレイ実験で得られるデータは、ランダムに近い弱いプログラムよりも強いプログラムを用いる方が信頼性の高いデータを得られると考えられる。一定の強さを持つ中将棋の思考プログラムを実現するために、機械学習手法の改善を図っている。エキスパートプレイヤによる手本となるデータのない中将棋において、機械学習を行うことを目指し、通常の将棋プログラムの機械学習において近年成果を上げている教師なし学習手法の調査および、その手法を参考にした中将棋プログラムの開発を実施している。中将棋を含む大将棋類は、通常の将棋と比較して大きな盤面と多数の駒を用いているため、機械学習の実験実施や、その後の計算機実験の実施においても一定の時間が必要となる。そのため、現時点ではまだ機械学習プログラムの開発と、その性能評価の段階となっている。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
予定通りに中将棋におけるプログラム開発を進めている。計算機実験の実施には一定の時間が必要であるため、現時点ではプログラム開発とその性能評価を行っている段階である。
|
今後の研究の推進方策 |
現在進めている「中将棋」の機械学習を行うプログラムの開発と評価を継続する。中将棋における教師なし学習において一定の成果を得ることができた段階で、中将棋の自動プレイ実験によるゲームデータの採取を行い、並行して、「大将棋」等の他の大将棋類におけるプログラム開発も実施予定である。なお、大きい盤と多数の駒を使用することから、現時点では機械学習を含む計算機実験の実施に、一定の時間がかかってしまう状況であり、プログラムの高速化についても検討をする予定としている。
|
次年度使用額が生じた理由 |
新型コロナウイルスの影響により、予定していた学会出張が取りやめになったため、次年度使用額が生じた。高速に計算を行う計算機の機材及び周辺機器の購入費用に充当する予定である。
|