2017 年度研究成果報告書

漸近最適戦略の動的適応学習アルゴリズムへの応用

研究課題

研究課題/領域番号	15K00344
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	ソフトコンピューティング
研究機関	大阪府立大学
研究代表者	野津亮大阪府立大学, 人間社会システム科学研究科, 准教授 (40405345)
研究分担者	本多克宏大阪府立大学, 工学(系)研究科(研究院), 教授 (80332964)
研究期間 (年度)	2015-04-01 – 2018-03-31
キーワード	強化学習 / 最適化問題 / 漸近最適戦略 / 自己組織化マップ / 意思決定 / クラスタリング
研究成果の概要	本課題では強化学習や最適化問題において確率論的に最適な選択を行うための方法について研究を進めた．選択肢が複数ある場合，過去の経験がどれだけあるか，良い結果がどれくらい見込めるかを基づいて判断する必要がある．本研究では強化学習や最適化問題においても同様であることを確認しつつ，最適な戦略を導入するための枠組みをいくつか考案することができた．特に，ベイズ推定の観点から強化学習アルゴリズム根本的に見直し，再構築できたことは学習と意思決定を切り分ける従来の一般的な考え方に一石を投じるものであると考えている．また，学習主体の状態推定を計算負荷をかけずに行う方法についても研究成果をあげることができた．
自由記述の分野	ソフトコンピューティング

2017 年度 研究成果報告書

漸近最適戦略の動的適応学習アルゴリズムへの応用

研究代表者

野津 亮 大阪府立大学, 人間社会システム科学研究科, 准教授 (40405345)

2017 年度研究成果報告書

野津亮大阪府立大学, 人間社会システム科学研究科, 准教授 (40405345)