平成28年度までには、「大将棋」と呼ばれる変種についての解析を行い、獅子という駒の特殊ルールの影響が、中将棋の場合と同様の影響をゲームの性質に与えている一方、大将棋ならではの特別な特徴となっているルールは見られないことを明らかにした。それらの成果をまとめ、論文発表(査読あり)を行っている。平成29年度は、その他の大将棋類についても同様の実験を進めており、一定の分析が進んだ時点でその成果発表を行う予定である。 ただし、これらの分析では強化学習によるプログラムの強化は行わず、駒価値のみを手動で設定した思考アルゴリズムで実施している。本研究の当初計画では、さらに信頼性の高いデータを採取する目的で強化学習の手法の改善をはかり、さらに強い思考アルゴリズムを持ったプログラムにおける自動プレイ実験を実施することを計画していた。しかし、使用駒数が多い大将棋類では実験に多くの時間を要することなどから、これまで実施していたTD学習法やその他の教師なし学習についても、まだ十分な成果を上げるに至っていない。そのために、大将棋類の各種解析を実施することを優先し、駒価値の設定を手動で行う実験により、データの採取を行ってきた。 現代将棋のプログラムにおいては、当初はプロ棋士のような非常に強い人間プレイヤの指し手の記録を使った教師あり学習により強いプログラムを作成していたが、現在では教師なし学習についても、様々な成果が報告されるようになっている。そのため、これらの現代将棋で成果を上げている手法を大将棋類に適用することを目指してシステムの開発と実験を進めている段階である。 さらに、これらの分析を通じて、将棋の歴史的変種のようなゲームの変種間の質的類似度を評価する定量的な尺度についても今後検討を行っていく予定である。
|