2017 年度研究成果報告書

推移確率行列未知のマルコフ決定過程の研究

研究課題

研究課題/領域番号	26400215
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
研究分野	数学基礎・応用数学
研究機関	神奈川大学
研究代表者	堀口正之神奈川大学, 理学部, 教授 (90366401)
研究分担者	中井達千葉大学, 教育学部, 教授 (20145808)
連携研究者	安田正實千葉大学, 理学研究科, 名誉教授 (00041244)
研究協力者	Alexey Piunovskiy Francois Dufour
研究期間 (年度)	2014-04-01 – 2018-03-31
キーワード	マルコフ決定過程 / 推移法則未知 / ベイズ学習
研究成果の概要	本課題は、意思決定過程における状態推移法則が未知である不確実環境下での最適化手法の研究である。具体的には、観測情報をもとに推移法則を区間推定してその区間に基づく最適化モデルを構成し、モデルの評価基準の区間表現を可能にするとともにその最適政策の特徴を明らかにした。また、不確実環境下での部分観測最適化問題として、ベイズ学習の研究に取り組み、最適停止問題および品質管理問題などにみられる区分確定的確率過程モデルでの最適化手法も導出した。
自由記述の分野	計画数学