研究実績の概要 |
平成27年度の当初の研究計画では、主に「中将棋」を題材として、盤の大きな将棋における駒価値等の学習手法の改善を目指す予定であった。元々行っていた強化学習の一種であるTD(Temporal Difference)学習法による学習の改善とその他の教師なし学習法の適用の両面から学習手法の改善を目指しているが、これらの計算機実験には一定の時間がかかることもあり、まだ十分な成果を上げるに至っていない。そこで、学習手法の改善を目指す実験と並行して、当初は平成28年度以降に実施する予定であった「大将棋」を対象とする実験について、学習を使わず手動で駒価値の設定を行った上で自動プレイ実験を行い、その棋譜の解析を行った。 その結果、大将棋は中将棋よりも使用駒数が多いことなどからゲームの終了に要する時間が多く必要となること、また、獅子という駒に関する特殊ルールの影響は、中将棋に対する解析で得られた結果と同様の影響をゲームの性質に与えており、大将棋ならではの特別な特徴は見られない事がわかった。これらの成果をまとめ、現在論文を執筆中である。 なお、本研究の関連事項として、平成27年度の研究開始時までに中将棋に対して行ってきた各種分析について取りまとめた成果を以下の国際会議にて発表を行った。「N. Sasaki, "The Evaluation of Chu-Shogi's Special Rules by Using a Computer Self-play Experiment", Proceedings of the 3rd International Conference on Applied Computing & Information Technology (ACIT 2015), Okayama, pp. 93 - 98, 2015.」
|