2008 Fiscal Year Final Research Report
Asymptotic Analysis of On-line Learning Based on Generalized Stochastic Processes
Project/Area Number |
18700157
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Allocation Type | Single-year Grants |
Research Field |
Intelligent informatics
|
Research Institution | Hiroshima City University |
Principal Investigator |
IWATA Kazunori Hiroshima City University, 大学院・情報科学研究科, 助教 (20405492)
|
Project Period (FY) |
2006 – 2008
|
Keywords | 確率的決定過程 / 強化学習 / マルチエージェントシステム / 階層クラスタ分析 |
Research Abstract |
強化学習における経験系列(状態,行動,報酬の時系列)やクラスタ分析に使われるデータは,一般に非定常・非エルゴードな確率過程に従う.本研究では,そのような一般的な系列・データに対しても有効な漸近的性質を使って,(1)マルチエージェントシステムの強化学習における漸近的性質,(2)強化学習によって収益の最大化が可能な確率的決定過程のクラス,(3)階層クラスタ分析におけるクラスタ間の新しい非類似度についての研究を行った.
|