研究課題/領域番号 |
22500131
|
研究種目 |
基盤研究(C)
|
配分区分 | 補助金 |
応募区分 | 一般 |
研究分野 |
知能情報学
|
研究機関 | 京都工芸繊維大学 |
研究代表者 |
飯間 等 京都工芸繊維大学, 工芸科学研究科, 准教授 (70273547)
|
研究分担者 |
黒江 康明 京都工芸繊維大学, 工芸科学研究科, 教授 (10153397)
|
研究期間 (年度) |
2010 – 2012
|
研究課題ステータス |
完了 (2012年度)
|
配分額 *注記 |
4,290千円 (直接経費: 3,300千円、間接経費: 990千円)
2012年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2011年度: 1,040千円 (直接経費: 800千円、間接経費: 240千円)
2010年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
|
キーワード | 強化学習 / PSO / 群知能 / Particile Swarm Optimization / Particle Swarm Optimization |
研究概要 |
短時間で最適な方策を学習するために、Particle Swarm Optimization(PSO)に基づく群強化学習法を提案し、連続状態行動空間を有する問題などの複雑な強化学習問題に提案方法を適用した。提案方法はエージェントと環境の組(これを学習世界と呼ぶ)を複数用意し、各学習世界のエージェントが個別に通常の強化学習法を用いて学習を行うとともに、PSO の更新式を用いた学習世界間の情報交換による学習も行う方法である。
|