研究課題
若手研究(B)
強化学習における経験系列(状態,行動,報酬の時系列)やクラスタ分析に使われるデータは,一般に非定常・非エルゴードな確率過程に従う.本研究では,そのような一般的な系列・データに対しても有効な漸近的性質を使って,(1)マルチエージェントシステムの強化学習における漸近的性質,(2)強化学習によって収益の最大化が可能な確率的決定過程のクラス,(3)階層クラスタ分析におけるクラスタ間の新しい非類似度についての研究を行った.
すべて 2009 2008 2007 2006 その他
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (26件) 備考 (1件)
電子情報通信学会論文誌 v.J91-D
ページ: 2196-2200
IEEE Transactions on Pattern Analysis and Machine Intelligence v.30
ページ: 76-88
情報科学技術レターズ v.6
ページ: 209-210
IEEE Transactions on Neural Networks v.17
ページ: 829-842
http://www.prl.info.hiroshima-cu.ac.jp/~kiwata/