deep reinforcement learning for imperfect and multi-player environments
Project/Area Number |
18K19832
|
Research Category |
Grant-in-Aid for Challenging Research (Exploratory)
|
Allocation Type | Multi-year Fund |
Review Section |
Medium-sized Section 62:Applied informatics and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
Kaneko Tomoyuki 東京大学, 大学院総合文化研究科, 准教授 (00345068)
|
Project Period (FY) |
2018-06-29 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥5,850,000 (Direct Cost: ¥4,500,000、Indirect Cost: ¥1,350,000)
Fiscal Year 2020: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2019: ¥2,470,000 (Direct Cost: ¥1,900,000、Indirect Cost: ¥570,000)
Fiscal Year 2018: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | ゲームプログラミング / 深層強化学習 |
Outline of Final Research Achievements |
This study extends deep reinforcement learning techniques into imperfect and multi-player games. As AlphaZero demonstrated, AI agents can learn decent strategies in perfect information games by reinforcement learning techniques. However, the learning is still difficult in more complicated situations, e.g., where some information is hidden and/or more than two agents are involved. Therefore, this study focused on learning in imperfect and multi-player games as a representative of challenging tasks.
|
Academic Significance and Societal Importance of the Research Achievements |
より広くコンピュータを社会に役立てるために,学習するAIエージェントの研究を行った.一般に,人が完璧なプログラムを事前に準備することはほぼ不可能であるため,コンピュータプログラムあるいはAIエージェント自身が適切な振る舞いを身につけることが望ましい.適切に学習させるためには様々な技術的な困難があり,人の教育でも様々な教育方法とトレードオフがあるように,目的に応じて適切な技術を使い分けたり,新たに開発する必要がある.ここでは,複雑な振る舞いが必要とされる状況の題材として,不完全情報とマルチエージェントゲームを題材として,学習方法を研究した.
|
Report
(5 results)
Research Products
(40 results)