研究課題/領域番号 |
16H02927
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
エンタテインメント・ゲーム情報学
|
研究機関 | 東京大学 |
研究代表者 |
金子 知適 東京大学, 大学院情報学環・学際情報学府, 准教授 (00345068)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
5,330千円 (直接経費: 4,100千円、間接経費: 1,230千円)
2018年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2016年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
|
キーワード | ゲームプログラミング / ゲーム情報学 / 人工知能 / 機械学習 / 並列計算 |
研究成果の概要 |
アルファ碁が人工知能全体の進歩として社会に衝撃を与えたように,ゲームを題材として人工知能研究はめざましく進歩している.この研究課題では,ゲームAIの賢さを実現する機械学習(特に強化学習)とゲーム木探索という基礎技術を研究した.さらに,並列分散計算を活用した高速化にも取り組んだ.現在の強化学習の枠組みではAIが賢さを身につけるために膨大の計算時間が必要で,社会で広く使うことが難しいためである.
|
研究成果の学術的意義や社会的意義 |
研究計画の通りに機械学習とゲーム木探索とその並列実行について研究した.また採択後に大きく発展したAlphaGoに代表するGPU計算と強化学習についても,最新技術を研究に反映させた.成果の一つであるUniformity regularizationという学習方式については,tensorflow及びchainer上で実装し,囲碁,将棋,チェスなど代表的なゲームを題材に性能を示した.成果全体を総合して15件の論文を公表した.
|