研究課題/領域番号 |
15K00506
|
研究機関 | 九州工業大学 |
研究代表者 |
中村 貞吾 九州工業大学, 大学院情報工学研究院, 准教授 (40198221)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | ゲームプログラミング / モンテカルロ木探索 / 組合せゲーム理論 / 囲碁 |
研究実績の概要 |
AlphaGo の成功により,盤面全体を入力として深層学習を行なう局面評価手法の有効性が認識されたが,学習に必要とされる大量の局面データとその評価結果の作成にはモンテカルロ木探索が用いられ,また,対局においても,ニューラルネットワークによる局面評価とモンテカルロ木探索の結果を混合した評価値が用いられている.本研究は,思考ゲームの解析を目的としているが,その目的においても,モンテカルロ木探索の性能向上は重要な課題である. 通常のモンテカルロ木探索では,探索の末端局面から行なわれるロールアウトと呼ばれるシミュレーションによって得られた最終局面の勝敗結果に加えて,ロールアウト中に得られる統計情報としてのモンテカルロオーナーやクリティカリティなどを利用した探索が行なわれているが,囲碁における攻合いなどの深い読みを必要とする一本道の探索ではまだまだ課題も残っている.これらの問題の中には,着手の見合い関係や順序関係の知識を利用すれば解決できるものがある.そこで,2手の着手(の着手点)の関係性に着目したクリティカリティを提案し,ロールアウト中に「見合い」や「順序関係」に関する情報を取得して,その後の探索に利用する探索手法を開発した. また,棋譜の自動解説を目的として,囲碁局面に対して適切な囲碁用語を付与するための予備実験を行なった.新聞の解説記事から取得した局面と囲碁用語を入力とした機械学習により,ある程度適切な囲碁用語が付与できることを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
新たなクリティカリティの提案とそれを用いたモンテカルロ木探索手法の開発により,攻合い局面探索の改善を行なった.この手法により,囲碁プレイヤにとって重要な概念である「見合い」の検出も行なうことが可能となったが,現在はまだ,その結果を利用した局面解説までは実現できなかった.また,人間が局面を理解するためには,盤面全体を対象とするだけでなく,部分局面に分解した上での理解が必要とされるが,局面分割の手法の確立までには至らなかった.
|
今後の研究の推進方策 |
AlphaGo の成功により,盤面全体を入力として直接評価する手法の有効性が認識されたといえるが,人間がゲーム局面を理解するためには,全体局面を部分局面に分解して個々の部分局面を理解した上で,それらの関連性を認識して全体局面の理解へとつなげる過程が必須であり,これを言語モデルになぞらえてモデル化することを試みる.そこでまず,認識の単位となりうる部分局面を棋譜から収集するとともに,新聞や雑誌の解説記事から取得した囲碁用語との対応づけを行なう.また,部分局面の数理解析結果に基づいて局面を分類・整理して,各部分局面の共起性をもとにして部分局面間の関係づけを行なうというアプローチで研究を進める予定である.
|