本応募課題では,思考ゲームを題材に並列分散探索と機械学習の隣接部分について理論と実装の両面から研究を進め,汎用性のあるフレームワークを構築する.現在では広い研究テーマで大規模な機械学習が必要とされている.思考ゲームでも囲碁将棋の評価関数や方策の獲得を基礎に,プレイスタイルや局面解説など挑戦的なテーマにまで及ぶ.そのような大規模な学習を現実的な時間で行うためには,並列分散計算の活用が肝要であるが,実用化は容易ではなかった.最終年度である本年度ではこれまでの研究を基礎として Uniformity regularizationというあらたな学習方式を提案した。またtensorflow及びchainer上で実装し、提案手法が並列・分散環境での学習に適することを、囲碁、将棋、チェスを題材に示した。主要な成果は、囲碁についてはAn Alternative Multitask Training for Evaluation Functions in the Game of Goに、将棋とチェスについてはHeterogeneous Multi-Task Learning of Evaluation Functions for Chess and ShogiおよびBuilding Evaluation Functions for Chess and Shogi with Uniformity Regularization Networksにまとめられている。
|