AlphaGo の成功により,囲碁において,盤面全体を入力として深層学習を行なう局面評価手法の有効性が認識された.一方で,人間がゲーム局面を理解してプレイするためには,盤面全体を漠然と画像的に眺めるのではなく,盤上の数々の特徴を捉えた上で,それらの関連性を認識して論理的に積み上げていく過程が重要であり,これを言語モデルになぞらえてモデル化することを目指している.また,人間がゲームを学習する上でも,自然言語による解説など,ゲーム局面から自然言語表現への変換は重要な課題となる. 囲碁の棋譜解説においては,ある着手が局所的には同じ配置のように見えても,着手の役割・意図などに応じて異なる囲碁用語が使い分けられる.本研究では,着点を中心とした部分領域内の石の配置と手順情報を入力とするニューラルネットワークを構築し,解説記事中の囲碁用語を用いて学習することで,部分的に同一の形状でも状況に応じた適切な囲碁用語の選択ができることを示した. また,実際に棋譜解説を行なうには,どの着手を解説するのかの選択も行なわなければならない.例えば,新聞や雑誌などの棋譜解説では,紙面のスペースの制約により,当たり前の着手よりも特筆すべき着手の方が解説対象として選ばれやすいと考えられるし,指導対局の後に行なわれる講評などでは,対局相手の棋力に応じて解説着手や内容を選ぶ必要もある.そこで,囲碁AIのバリューネットワークとポリシーネットワークを用いて,着手による勝率の変動と着手の打たれやすさを評価して,解説候補着手の判別を行なった.さらに,対局者の個々の着手が最善手からどの程度乖離しているかを誤謬度とし,一局の中での誤謬度の分布を用いて,対局者の棋力を推定する手法を提案し,その有効性を検証した.
|