Deriving Appropriate Utility in Agent Learning
Project/Area Number |
18700145
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Osaka University |
Principal Investigator |
MORIYAMA Koichi Osaka University, 産業科学研究所, 助教 (10361776)
|
Project Period (FY) |
2006 – 2008
|
Project Status |
Completed (Fiscal Year 2008)
|
Budget Amount *help |
¥2,510,000 (Direct Cost: ¥2,300,000、Indirect Cost: ¥210,000)
Fiscal Year 2008: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
Fiscal Year 2007: ¥800,000 (Direct Cost: ¥800,000)
Fiscal Year 2006: ¥800,000 (Direct Cost: ¥800,000)
|
Keywords | 人工知能 / 強化学習 / エージェント / マルチエージェントシステム / ゲーム理論 / 効用 / Q学習 / 囚人のジレンマゲーム |
Research Abstract |
本研究課題は,人工知能研究の一分野である強化学習において,従来は同一視されてきた個体(エージェント)外からの報酬と,エージェント自身の主観的効用を分けて考えることで,最も単純なマルチエージェント環境である2人2行動同時手番対称ゲームで適切に行動する強化学習エージェントの構築を目的とした.研究の結果,囚人のジレンマゲームにおいて協調行動を続けやすくする効用の条件を導き,さらに別の種類のゲームで報酬を追求することを妨げない学習手法を開発した.
|
Report
(4 results)
Research Products
(20 results)
-
-
-
-
-
-
-
-
-
-
-
-
-
[Journal Article] Reinforcement Learn-ing on a Futures Market Simulator2007
Author(s)
Koichi Moriyama, Mitsuhiro Matsumoto, Ken-ichi Fukui, Satoshi Kurihara, and Masayuki Numao
-
Journal Title
Proceedings of the first KES Symposium on Agent and Multi-Agent Systems - Technolo-gies and Applications, KES-AMSTA 2007 (Lecture Notes in Artificial Intelligence 4496)
Pages: 42-52
Related Report
Peer Reviewed
-
-
-
-
-
-
-