2016 Fiscal Year Annual Research Report
Project/Area Number |
16H02927
|
Research Institution | The University of Tokyo |
Principal Investigator |
金子 知適 東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)
|
Project Period (FY) |
2016-04-01 – 2019-03-31
|
Keywords | ゲームプログラミング |
Outline of Annual Research Achievements |
本応募課題では,思考ゲームを題材に並列分散探索と機械学習の隣接部分について理論と実装の両面から研究を進め,汎用性のあるフレームワークを構築することを行っている.現在では,広い研究テーマで大規模な機械学習が必要とされているため,思考ゲームの分野でも将棋における局面の評価関数,コンピュータ囲碁における着手の方策獲得から,プレイスタイルや局面解説など挑戦的なテーマにまで及ぶためである.そのような大規模な学習を現実的な時間で行うために有効な,並列分散計算の活用を容易にするためのフレームワークのプロトタイプを当該年度に作成し,評価と改善に引続き取り組んでいる.具体的には,申請者は並列分散探索手法についてチェスと将棋で実績を有していたため,将棋を対象として探索を含む機械学習手順の効率化を実現するフレームワークを作成した.さらに,その性能評価とともに,囲碁で主流の方策学習や強化学習をも扱えるようなフレームワークの拡張にも,取り組んできている.さらに作成したフレームワークの応用研究として,学習時のゲーム木探索の深さを深くすること学習で得られる評価関数が正確になるメリットと計算コストのトレードオフの検証,着手の時系列方向に関して情報を強化学習風に伝播させることのコストと効果の分析,並列計算時の同期的情報共有による学習制度の向上と並列度低下のトレードオフの分析などの複数のテーマを準備中であり,予備的な実装を行った.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
概ね計画通りに研究を進められている。
|
Strategy for Future Research Activity |
初年度は概ね計画通りに研究を進められたので,次年度も当初計画に従って着実に研究を推進する。
|
Research Products
(10 results)