2023 Fiscal Year Final Research Report
Onto generalization of reinforcement learning agents through diversity and understanding of environments
Project/Area Number |
21H03570
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Basic Section 62040:Entertainment and game informatics-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
Kaneko Tomoyuki 東京大学, 大学院総合文化研究科, 教授 (00345068)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ゲームプログラミング |
Outline of Final Research Achievements |
This study focuses on reinforcement learning in perfect information games where AI agents master a given game throughout trials and errors in playing without human assistance such as AlphaZero. Our contribution includes mathematical models, implementation in computer software, and computational experiments for performance evaluation. A part of our results is already available as an open-source software with pre-trained models and more will become available in future.
|
Free Research Field |
ゲームプログラミング
|
Academic Significance and Societal Importance of the Research Achievements |
強化学習は、教師あり学習で必要となる教師データを必要としない代わりに、試行錯誤の経験を積むための計算機資源を必要とする。この研究の遠い目標は、高性能なAIエージェントを少数の巨大組織のみが開発できる状況を変え、個人が自分自身のハードウェアで自分だけのエージェントを持てるようにすることにある。ゲームという限られた対象限定ではあるが、本研究は、一般的なハードウェアで十分に強いエージェントを作成可能となったことに貢献している。
|