研究課題/領域番号 |
15K00506
|
研究機関 | 九州工業大学 |
研究代表者 |
中村 貞吾 九州工業大学, 大学院情報工学研究院, 准教授 (40198221)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | ゲームプログラミング / 囲碁 / 棋譜 / 解説 |
研究実績の概要 |
AlphaGo の成功により,囲碁において,盤面全体を入力として深層学習を行なう局面評価手法の有効性が認識された.また,最近では,ルール以外の知識を用いずに自己対戦のみから学習する手法が囲碁,および,それ以外のゲームでも有効に働くことが示され,ゲームAIの実力はますます向上の一途をだどっている.一方で,人間がゲーム局面を理解してプレイするためには,盤面全体を漠然と画像的に眺めるのではなく,盤上の数々の特徴を捉えた上で,それらの関連性を認識して論理的に積み上げていく過程が重要であり,これを言語モデルになぞらえてモデル化することを目指している.また,人間がゲームを学習する上でも,自然言語による解説など,ゲーム局面から自然言語表現への変換は重要な課題となる. 囲碁の棋譜解説においては,ある着手が局所的には同じ配置のように見えても,周囲の状況や打たれた手順によって異なる囲碁用語が使い分けられるため,着手の役割・意図やゲームの内容を正しく伝えるためには,囲碁用語を適切に使用する必要がある.そのために,各用語に対して判別に必要な特徴を設定してルールベースで判別を行なうアプローチも行なわれているが,特徴量の設計自体困難な作業であるため,本研究では,盤面の情報から予め特定の特徴を抽出することなく機械学習によって着手に対する適切な囲碁用語を割り当てる手法をとる.ただし,自己対戦によって大量の学習データが用意できる局面評価とちがって,用語割当ての学習用データは限られるので,盤面全体を対象とするのではなく,着点を中心とした部分領域内の配置と手順情報のみを入力とするネットワークを構築し,少数の囲碁用語に対して,部分的に同一の形状でも状況に応じた適切な囲碁用語の選択ができることを示した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
棋譜解説における着手に対する適切な囲碁用語の割当ては,着手周辺の状況依存性があり,現在は,着点を中心とした部分領域内の配置と手順情報を用いることで少数の囲碁用語の使い分けの判別が十分に行なえることを示した.特に,領域内の着手の相対的な順序関係を用いることで,判別性能が向上することがわかった.しかし,対象とする囲碁用語の種類を拡大したときには,注視領域も変動することが考えられるので,それについての対策が必要となる.さらに,囲碁用語は,同一の状況であっても,それをどのように捉えているかによって異なる用語を割り当てることが可能であるというマルチラベル性を持っているため,その使い分けを含めた学習用データの収集が必要となるが,まだ十分に整備が行なえていない. また,現時点では,囲碁用語の付与にとどまり,最終的な解説文生成には至っていない.
|
今後の研究の推進方策 |
棋譜からの解説文の自動生成のために,(1) 解説する局面・着手の選択,(2) 局面・着手の評価,(3) 解説内容の文章化,の3つのステップを実現する. (1) については,一局の形勢の推移を考慮しつつ,ストーリー性を持った解説を行なうためのシナリオを構築した上で,その基準にしたがった局面選択を行なう予定である.また,(2) については,深層学習を用いた囲碁AIの局面評価,および,これまでに開発した組合せゲーム理論の考え方を含んだモンテカルロ木探索の結果を利用する.(3) については,これまでに,新聞の解説記事から解説表現パターンを獲得しており,それを用いて文生成を行なうべく,現在,準備を進めている.
|