研究課題/領域番号 |
16J02092
|
研究機関 | 北海道大学 |
研究代表者 |
高田 圭 北海道大学, 情報科学研究科, 特別研究員(DC1)
|
研究期間 (年度) |
2016-04-22 – 2019-03-31
|
キーワード | 深層学習 / ゲーム木探索 |
研究実績の概要 |
今年度は特別研究員の申請書における研究計画通り,局面状態の分類に基づく局面評価に関する研究を重点的に行った.本研究は,ボードゲームを対象に研究を進めている.膨大な探索空間を効率的に探索するためには,評価精度の高い局面評価手法の開発が必要である.評価精度の向上を目的に、人間が感覚的にとらえている序盤,中盤や終盤といった局面状態を分類し,動的に局面評価方法を変更する手法の開発を行っている.局面状態は便宜的に序盤・中盤・終盤と分類可能である.局面状態数を事前に定め評価方法を変更する手法は提案されているが,本来すべての局面において重要視するべき戦略は異なるため,事前に局面状態を決定して評価する方法では柔軟な局面評価が困難である.局面状態数を事前に定めずに、局面状態に応じた評価手法に関する研究を行った. これまでの研究から局面をネットワークとして捉え、ネットワークから計算されるネットワーク特徴量を用いて局面状態を分類可能であることを示している.近年,深層学習を用いて人手で抽出困難な特徴を学習する方法が提案されている.ネットワーク特徴量では表現することが困難な局面の特徴を学習することが可能であれば,局面状態を細かく分類可能であると考えられる.研究対象であるHexと呼ばれるボードゲームに対する深層学習の適用方法についての研究を行い,国内学会で研究成果を報告した.この発表では,熟練者の手を再現するモデルを作成し,Hexにおいて局面の特徴を学習可能な深層学習モデルに関する議論を行った.提案モデル,既存の深層学習を用いたモデルと既存の線形モデルの計3種類のモデルの比較を行い,提案手法が他の手法よりも高精度に熟練者の手を再現可能であることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初の研究計画通り,局面状態に基づく局面評価を目指し研究を進めた.局面状態を分類するにあたり,局面の特徴をより詳細に捉える必要があるため,深層学習に注目した.研究対象であるHexに対して深層学習を適用するにあたり,Hexの特性を考慮した適用手法を提案した.提案手法が既存手法より高精度な着手予測が可能であることを示し,国内学会において研究成果を発表した.現在は深層学習を用いて,局面状態に基づく局面評価手法の開発を行っている.現在提案手法の数値計算実験中であり,研究成果がまとまり次第,学会・学術論文等で発表する予定である. Hexに対する深層学習の適用方法に対する学会報告,局面状態に基づく局面評価手法が既存手法より有効であることを明らかにするための数値計算実験を現在行っている点から,おおむね当初の研究計画通りであるとした.
|
今後の研究の推進方策 |
これまでの研究から,深層学習をHexに適用することで,既存のネットワーク特徴量に基づく手法より優れた着手予測が可能であることを示した.これは,深層学習を用いることで,より詳細に局面の特徴を捉えていることを示している.今後の研究方針は,深層学習を用いた局面状態に基づく局面評価手法を提案することである.提案した手法を既存手法と比較することで,局面状態に応じて局面評価方法を変更することが有効であることと,既存手法よりも優れた手を探索可能であることを示す.その成果を学会・学術論文等で発表予定である.
|