研究課題/領域番号 |
15K00344
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
ソフトコンピューティング
|
研究機関 | 大阪府立大学 |
研究代表者 |
野津 亮 大阪府立大学, 人間社会システム科学研究科, 准教授 (40405345)
|
研究分担者 |
本多 克宏 大阪府立大学, 工学(系)研究科(研究院), 教授 (80332964)
|
研究期間 (年度) |
2015-04-01 – 2018-03-31
|
研究課題ステータス |
完了 (2017年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2016年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2015年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | 強化学習 / 最適化問題 / 漸近最適戦略 / 自己組織化マップ / 意思決定 / クラスタリング / オンライン型 / 認知モデル |
研究成果の概要 |
本課題では強化学習や最適化問題において確率論的に最適な選択を行うための方法について研究を進めた.選択肢が複数ある場合,過去の経験がどれだけあるか,良い結果がどれくらい見込めるかを基づいて判断する必要がある.本研究では強化学習や最適化問題においても同様であることを確認しつつ,最適な戦略を導入するための枠組みをいくつか考案することができた.特に,ベイズ推定の観点から強化学習アルゴリズム根本的に見直し,再構築できたことは学習と意思決定を切り分ける従来の一般的な考え方に一石を投じるものであると考えている.また,学習主体の状態推定を計算負荷をかけずに行う方法についても研究成果をあげることができた.
|