配分額 *注記 |
3,600千円 (直接経費: 3,300千円、間接経費: 300千円)
2008年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2007年度: 1,000千円 (直接経費: 1,000千円)
2006年度: 1,300千円 (直接経費: 1,300千円)
|
研究概要 |
強化学習における経験系列(状態,行動,報酬の時系列)やクラスタ分析に使われるデータは,一般に非定常・非エルゴードな確率過程に従う.本研究では,そのような一般的な系列・データに対しても有効な漸近的性質を使って,(1)マルチエージェントシステムの強化学習における漸近的性質,(2)強化学習によって収益の最大化が可能な確率的決定過程のクラス,(3)階層クラスタ分析におけるクラスタ間の新しい非類似度についての研究を行った.
|