主にWeak proof number searchを将棋の通常探索で使う研究を中心に将棋終盤アルゴリズムの開発をしており、特定の問題セットで難しい寄せを読み切り高い正解率を得ることに成功したが、自己対戦および他プログラムとの対戦実験で有意に高い勝率を得ることを目標に研究を続けている.将棋終盤以外では、今年度はあから2010プロジェクトの一員として清水女流王将との対戦を控えプロと対戦するための序盤戦略の考案を行い、結果コンピュータ将棋の対プロ棋士戦初勝利をあげた。また、近年主に囲碁で流行しているモンテカルロ木探索を将棋終盤探索に応用するため、特にUCTの研究を囲碁とオセロを題材に行った。まず囲碁を題材にUCT木の成長を決めるnode expansionについて研究を行い、効率的なnode expansion手法を三種類提案し、実験でその優位性を示した。次に将棋で得られた勾配法を用いる機械学習の知見(Bonanza Method)を元に、囲碁で従来手法より精度の高い評価関数を機械学習により計算することに成功し、対戦実験でその優位性を示した。また、オセロを題材に局面評価関数を使ってUCT探索をコントロールし、高い探索性能を上げる手法UCT+を提案、オセロで高い性能を示すことに成功したほか、オセロ求解に向けてαβ法に近い単純な縦型探索をベースに証明数探索に近いパフォーマンスを出す新たな探索法を提案した。
|