研究概要 |
目標とする名人を超えるコンピュータ将棋ソフトの作成のため,現在コンピュータ将棋の大きな弱点である序盤の改良に重点を置いて研究を行った.まず,数ある戦法の中からコンピュータが自身の得意な戦法を選べるようにする方法に関して研究を行った.多数の対局を通してコンピュータに得意戦法を学習させる試みはチェスで既に行われており,多数の対局としてインターネット上のチェス対局サーバにて不特定多数の相手と対局を行っている.しかし,将棋で同様の方法をとることは現実的ではないため,多数の自己対戦による学習を試みた.実験の結果,自己対戦を通しての学習によってもコンピュータが自身の得意な戦法を選びやすくなることがわかり,現在この方法を用いて得意戦法の学習を続けている.次に,コンピュータ将棋が苦手とする長期的視点に基づいた駒組みや,作戦がちといった序盤の形勢判断を可能にするための評価に関する研究を行った.現在の駒組み評価は,ある位置にある駒があれば何点,という評価が一般的に行われている.しかし実際人間が行っている評価は,ある位置に単独で駒があって何点というものではなく,ある位置に特定の駒があり,さらに別の位置にある駒があれば何点という,部分的な形で評価しているものが多い.このため,そのように部分的な形で陣形が評価できるよう評価関数を改良し,現在コンピュータがほとんど評価できていない棒銀といった作戦を先読みで行えるよう研究を続けている.
|