Budget Amount *help |
¥3,600,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥300,000)
Fiscal Year 2008: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2007: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2006: ¥1,300,000 (Direct Cost: ¥1,300,000)
|
Research Abstract |
強化学習における経験系列(状態,行動,報酬の時系列)やクラスタ分析に使われるデータは,一般に非定常・非エルゴードな確率過程に従う.本研究では,そのような一般的な系列・データに対しても有効な漸近的性質を使って,(1)マルチエージェントシステムの強化学習における漸近的性質,(2)強化学習によって収益の最大化が可能な確率的決定過程のクラス,(3)階層クラスタ分析におけるクラスタ間の新しい非類似度についての研究を行った.
|