研究概要 |
近年発展している効果的な探索アルゴリズムを対象に, 経験的知識を活用することで, さらに効率を向上させるための手法について研究した. 手順としてはまず, それぞれのアルゴリズムに対してどのような知識が有効であるかを明らかにし, 続いて, そのような知識を棋譜や探索木などの大量のデータからの学習によって獲得する手法を研究した. 対象となる探索問題として, 適度に複雑でかつ成果が期待できる題材である, 将棋と囲碁を選んだ. これらの分野はプロ棋士の棋譜という形で, 分野に精通した人間の判断履歴が利用可能である点で本研究に適している. 一般には, 人間の知識は例外が多く, 単純に組み合わせただけでは副作用が多いことが知られている. 本研究では棋譜に残された人間の判断に着目し兄弟節点の比較に基づく統計的モデルを立てることでその問題に対処し, 機械学習の種々の手法の応用を可能にすることができた. 最終的に, 獲得した知識を組み込んだプログラムが実際に探索が効率的であり, さらにゲームにおいても実際に強いことを示し, 提案手法の有効性を検証した. コンピュータ将棋においては, トップレベルのプログラムに研究成果を加えることで, 従来の半分程度の探索節点数で従来のプログラムに9割程度勝ち越すことができた. コンピュータ囲碁においては対局を行うまでにいたらなかったが, コンピュータ囲碁において有力なモンテカルロ木探索というアルゴリズムにおいても, 提案手法が有効であることが共同研究により示された。性質がまったく異なる囲碁と将棋という二つの分野において有効性が示されたことにより, 本研究は汎用的に様々な分野に応用可能であると考えられる.
|