将棋や囲碁などのゲームではゲーム後にプレイヤ同士で「感想戦」と呼ばれるゲーム内容の検討を行い、実力向上に役立てる。ゲームAIにおいては、このような「感想戦」が行われることはない。一般に行われる学習では、棋譜の指手による学習が主であった。本研究では人間が行う「感想戦」のように、複数のゲームAIによるゲームの検討とそれによる棋力向上を目的とする。 最終年度は、複数のAIによるゲームの検討する手法として、助言を活用するゲームAI についての研究を行った。あるゲームAIに、そのAI自身による指手の候補と他のゲームAIによる指手の候補とを比較検討させ、最終的な指手を決定する手法を提案した。従来は、単純な多数決や3-Hirn System と呼ばれる手法などがゲームでも提案されている。今回の手法が既存の単純多数決よりも有効であることを対戦などから示し、ゲームAIにおける助言の有効性を示した。この研究テーマは、助言による性能向上は人間とAIの協調と見ることができ、他の研究テーマとも横断することができた。 研究期間全体としては、ゲーム内容の検討について研究を行い、その過程で棋譜の指手からプレイヤの強さを推測する研究を行った他、ゲームAIの評価関数の学習における教師データ生成のために複数プレイヤの利用についての研究を行い、上述の最終年度の研究を行った。 本研究の目的は複数のゲームAIによる検討の有効性の調査とそれを用いたゲームAIの強化が目的であった。感想戦から学習を行う実施計画とは異なる形であるが、助言を受けることでゲームAIとして強化する手法、すなわち複数のゲームAIによる検討とそれによる強化という目的を達成することが出来たといえる。
|