2018 Fiscal Year Research-status Report
Project/Area Number |
17K00506
|
Research Institution | Japan Advanced Institute of Science and Technology |
Principal Investigator |
池田 心 北陸先端科学技術大学院大学, 先端科学技術研究科, 准教授 (80362416)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 楽しませる / 囲碁 / ゲーム / 教師あり学習 / 深層強化学習 / 教える / 人間らしさ |
Outline of Annual Research Achievements |
本研究全体の目的は,非常に強くなった囲碁プログラムを,初級者中級者の指導に活用する方法論を確立し,またそこで得られた技術や知見を他のゲームにおける教育にも応用していくことである. 2018年度の研究内容は,申請時点では「プレイヤの弱点分析法」「例題の提示法」および「悪手指摘法」の考案と改善であった.近年急速に進化する深層学習囲碁プログラムの現状を踏まえ,申請時点から若干の計画の修正を加え,1. 深層学習囲碁プログラムを用いた場合の手加減や多様な戦略演出の可能性を考察改善する,2. 適切な難易度かつ面白いと思える例題の提示法,を中心の目標とした. 1. については,AlphaZeroアプローチを再現したElfOpenGo, LeelaZeroといった強いオープンソースプログラムに手を加えることにより,従来と同レベルの手加減ができること,同時に多様な戦略演出には課題が多いことが判明し,これらを論文にまとめた.戦略演出のためには,いわゆるAlphaZeroの学習を別の評価関数を用いて行い,複数のネットワークを保持することが有望であると考えている.これは国際会議への投稿も予定している. 2. については,RPG,ぷよぷよ,ガイスター,テトリスなどの比較的単純なゲームについて,様々な手法で例題を生成し,かつその難易度や面白さを推測するというアプローチをとった.RPGについては深層強化学習,ぷよぷよやテトリスでは教師あり学習を用いることで,ある程度面白さを推測し,厳選問題を出すことが可能になりそうだというめどをつけることができた.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
前年度の進捗状況報告にも書いた通り,深層学習の進展は早く,囲碁プログラムのスタンダードも急激に変化している.これに対応することはおおむね順調にできており,ElfやLeelaといった他者のプログラムを,自分の目的のために改変することには成功している.問題生成に関する知見も積み重なっていて,1年分の進捗は認められる. 上記の意味では2年目だけ見れば順調とも言えるが,3年間での成果物が当初予定していたものになるかという意味だと少し遅れていることは認めざるを得ないことと,論文の出版が十分でない点から,やや遅れていると評価する.
|
Strategy for Future Research Activity |
最終年度は,1. 総合的に見たとき,申請時に目標としていた内容を網羅すること,2. 一般に研究として完成度を高め発展させること,3. 質の高い論文を複数投稿出版すること の方向性を意識して研究を進めるが,これらを両立することは難しいかもしれない.現在までに得られている知見のうち重要会議での発表がされていない部分については行うことを最優先とするが,申請時点での内容の網羅よりは,有望となっている部分についての完成度を高めることを優先したいと考えている.
|
Causes of Carryover |
当初予算と比べ,想定していた国際会議への参加を行わなかったために旅費は少額となった.代わりに深層学習用の計算機の購入を行ったが,端数については2,718円と少額であったためにちょうど使い切るような措置は行わなかった. 最終年度には被験者実験が多く予想され,この謝金のために援用する予定である.
|