配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2011年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2010年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2009年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
研究概要 |
本研究において,学習エージェントは自らの学習のための探索空間を自らの試行錯誤の過程の中で徐々に分節化していく(分割,統合,軸のぶれ等を繰り返す).この自動的な分節化の方法についていくつか提案,実験,検討した.さらに派生的な研究として,鎖型強化学習と名付けた手法を開発し,目標状態につながる状態と行動の組をつなげていくように保存する学習アルゴリズムにより, Q学習と比較して大幅にメモリ使用量を減らすことに成功した. PSOの学習への応用,複素強化学習の改良,主成分分析による転移学習への影響調査, CO2排出量を検討するための都市シミュレータの開発なども行った.
|