研究課題/領域番号 |
18K19832
|
研究種目 |
挑戦的研究(萌芽)
|
配分区分 | 基金 |
審査区分 |
中区分62:応用情報学およびその関連分野
|
研究機関 | 東京大学 |
研究代表者 |
金子 知適 東京大学, 大学院総合文化研究科, 准教授 (00345068)
|
研究期間 (年度) |
2018-06-29 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
5,850千円 (直接経費: 4,500千円、間接経費: 1,350千円)
2020年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2019年度: 2,470千円 (直接経費: 1,900千円、間接経費: 570千円)
2018年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
|
キーワード | ゲームプログラミング / 深層強化学習 |
研究成果の概要 |
不完全情報かつ多人数のゲームを題材に,モデルを持つ深層強化学習に関する研究を行った.強化学習はAlphaGoの成功で有名なように囲碁やビデオゲームで顕著な成果をあげているが,本研究ではその対象をさらに広げて現実に近い複雑さを持つ問題の例として,不完全情報かつ多人数のゲームを扱う.問題が複雑になるほど,エージェ ントの学習は困難になる.そこで本研究では,既存技術である深層学習に加えて,不完全情報かつ多人数を扱うことに適したモデルの獲得と精密化を行う学習フレームワークを研究した.
|
研究成果の学術的意義や社会的意義 |
より広くコンピュータを社会に役立てるために,学習するAIエージェントの研究を行った.一般に,人が完璧なプログラムを事前に準備することはほぼ不可能であるため,コンピュータプログラムあるいはAIエージェント自身が適切な振る舞いを身につけることが望ましい.適切に学習させるためには様々な技術的な困難があり,人の教育でも様々な教育方法とトレードオフがあるように,目的に応じて適切な技術を使い分けたり,新たに開発する必要がある.ここでは,複雑な振る舞いが必要とされる状況の題材として,不完全情報とマルチエージェントゲームを題材として,学習方法を研究した.
|