2015 Fiscal Year Research-status Report
Project/Area Number |
26400215
|
Research Institution | Kanagawa University |
Principal Investigator |
堀口 正之 神奈川大学, 理学部, 教授 (90366401)
|
Co-Investigator(Kenkyū-buntansha) |
中井 達 千葉大学, 教育学部, 教授 (20145808)
|
Project Period (FY) |
2014-04-01 – 2018-03-31
|
Keywords | マルコフ決定過程 / 推移法則が未知の場合 |
Outline of Annual Research Achievements |
推移法則未知のマルコフ決定過程における推定手法および学習理論の研究に継続的に取り組んでいる。推移法則のパラメータに対する事前確率を区間で表現しそれをもとに事後区間推移確率を構成する区間推定型マルコフ決定モデルについて、逐次決定により増加していく情報をもとにした適応的意思決定手法としての学習理論とその学習によって導出される最適政策についての研究に取り組んでいる。具体的には、真の推移法則の情報が未知の場合には、状態観測と逐次決定により蓄積されていく情報集合に基づいてベイズ統計による推移法則の推定とその推定に基づく最適化モデルが構成され、区間型の最適方程式から評価関数は上限と下限を持つ区間に表現される。今年度は、品質管理におけるマルコフ決定モデルに関して、ベイズアプローチによる故障発生分布のパラメータに対する学習理論と適応政策の最適性の研究に取り組み推定制御による適応手法を明らかにした。また、システムの特性的パラメータが区分的に変化し得る一般的なマルコフモデルにおける最適制御の理論研究やシステム状態を間接的な観測情報から推定し逐次意思決定を行うモデルである部分観測可能なマルコフ決定過程における問題として、学習プロセスと逐次決定に対するベイズ的解析手法の研究へも取り組み、実際的応用としての品質管理モデル等への適用について共同研究セミナーを実施し今後の課題解決に向けて問題点の整理や既存研究からの展開に取り組んでいる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
推移法則未知のマルコフ決定過程において、品質管理モデルへのベイズアプローチによるパラメータの学習理論と適応政策の最適性について推定制御による適応手法を明らかにした。この数理モデルの拡張にさらに取り組むとともに、また、システムの特性的パラメータが区分的に変化し得る一般的なマルコフモデルにおける最適制御の理論研究や、システム状態を間接的な観測情報から推定し逐次意思決定を行うモデルである部分観測可能なマルコフ決定過程における問題として、学習プロセスと逐次決定に対するベイズ的解析手法の研究へも取り組み共同研究を進めている。適宜、成果発表やセミナーでの研究討議を行い課題解決に取り組んでおり本研究の目的は順調に進展している。
|
Strategy for Future Research Activity |
これまでの研究計画・方法を継続して進めると同時に、研究成果をまとめて各種の研究集会、学会、国際会議等で発表する。具体的には、 (1)区間推定MDPモデルについて、完全情報下でのモデルとの比較から情報価値の評価に取り組む。また、未知情報を含む停止決定過程について、その区間推定最適化モデルの構築を目指す。 (2)適応的政策の構成など不確実性の下でのマルコフ決定過程の制御問題についてその学習理論の研究に取り組む。また、アルゴリズムの開発では、実用的な実行可能性にも配慮し効率的な逐次近似アルゴリズムの構築に取り組む。 (3)実際的な経済・社会問題に適用可能なモデル研究として、引き続き品質管理問題や支出問題の研究に取り組む。
|
Causes of Carryover |
旅費支出に関して予定の変更で残額が生じ次年度に繰り越すこととした。
|
Expenditure Plan for Carryover Budget |
主に次年度の旅費として計画的に使用する。
|
Research Products
(6 results)