2015 年度実施状況報告書

コンピュータ自動プレイ実験による大将棋類の質的類似度の評価

研究課題

研究課題/領域番号	15K00507
研究機関	県立広島大学
研究代表者	佐々木宣介県立広島大学, 経営情報学部, 准教授 (20326424)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	大将棋 / 自動プレイ / 獅子ルール / 中将棋
研究実績の概要	平成27年度の当初の研究計画では、主に「中将棋」を題材として、盤の大きな将棋における駒価値等の学習手法の改善を目指す予定であった。元々行っていた強化学習の一種であるTD(Temporal Difference)学習法による学習の改善とその他の教師なし学習法の適用の両面から学習手法の改善を目指しているが、これらの計算機実験には一定の時間がかかることもあり、まだ十分な成果を上げるに至っていない。そこで、学習手法の改善を目指す実験と並行して、当初は平成28年度以降に実施する予定であった「大将棋」を対象とする実験について、学習を使わず手動で駒価値の設定を行った上で自動プレイ実験を行い、その棋譜の解析を行った。その結果、大将棋は中将棋よりも使用駒数が多いことなどからゲームの終了に要する時間が多く必要となること、また、獅子という駒に関する特殊ルールの影響は、中将棋に対する解析で得られた結果と同様の影響をゲームの性質に与えており、大将棋ならではの特別な特徴は見られない事がわかった。これらの成果をまとめ、現在論文を執筆中である。なお、本研究の関連事項として、平成27年度の研究開始時までに中将棋に対して行ってきた各種分析について取りまとめた成果を以下の国際会議にて発表を行った。「N. Sasaki, "The Evaluation of Chu-Shogi's Special Rules by Using a Computer Self-play Experiment", Proceedings of the 3rd International Conference on Applied Computing & Information Technology (ACIT 2015), Okayama, pp. 93 - 98, 2015.」
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由平成27年度に実施する予定であった学習手法の改善については、まだ十分な成果を上げていないが、一方で、平成28年度以降に実施する予定であった大将棋に対する計算機実験を前倒しで実施して、既に一定の成果を上げている。
今後の研究の推進方策	大将棋に関する実験では、駒価値の設定を手動でし、一定の成果を得ることができた。しかし、他の大将棋類について同様の計算機実験を実施する場合、全ての変種について手動で駒価値を設定することは手間がかかる。さらには、実験データの信頼性を高める目的で、より強い思考アルゴリズムとするために駒価値以外の評価を導入しようとすると、それらの評価要素を手動で調整していくことは難しい。そこで、当初から計画しているTD学習法による学習の改善および、他の教師なし学習の適用については、引き続き実施していく予定である。まずは中将棋での計算機実験において有効な手法を確かめたのち、他の大将棋類にも適用することを目指す。また、平成28年度以降は計算機実験の対象を中将棋、大将棋以外の大将棋類にも拡大していく予定である。複数の大将棋類における計算機実験のデータ解析を通じ、それぞれの変種の性質の違いを明らかにするとともに、中将棋がプレイヤが少ないながらも、現在まで生き残っている理由についての考察を行っていく予定である。さらに、これらの計算機実験を通じで得られた結果を利用して、「変種間の類似度をあらわす数値的な評価尺度」についても検討を行っていく。本テーマで対象としている大将棋類の他、過去に行っている小将棋類についてのデータも合わせ、さまざまな変種のデータについて、変種間の質的類似度を定量的に評価できるような評価尺度が導入できないか検討を行う。
次年度使用額が生じた理由	購入を予定していた一部の物品について、計画よりも安価に入手できたものがあったため。
次年度使用額の使用計画	高速に計算機実験を行う計算機およびその周辺機器に充当する予定である。

研究成果
(1件)

すべて学会発表 (1件)

[学会発表] 大将棋のルール評価の研究2015
- 著者名/発表者名
  佐々木宣介
- 学会等名
  ゲームプログラミングワークショップ 2015
- 発表場所
  駿河台学園　軽井沢学習研修所
- 年月日
  2015-11-06 – 2015-11-08