2015 Fiscal Year Research-status Report

推移確率行列未知のマルコフ決定過程の研究

Research Project

Project/Area Number	26400215
Research Institution	Kanagawa University
Principal Investigator	堀口正之神奈川大学, 理学部, 教授 (90366401)
Co-Investigator(Kenkyū-buntansha)	中井達千葉大学, 教育学部, 教授 (20145808)
Project Period (FY)	2014-04-01 – 2018-03-31
Keywords	マルコフ決定過程 / 推移法則が未知の場合
Outline of Annual Research Achievements	推移法則未知のマルコフ決定過程における推定手法および学習理論の研究に継続的に取り組んでいる。推移法則のパラメータに対する事前確率を区間で表現しそれをもとに事後区間推移確率を構成する区間推定型マルコフ決定モデルについて、逐次決定により増加していく情報をもとにした適応的意思決定手法としての学習理論とその学習によって導出される最適政策についての研究に取り組んでいる。具体的には、真の推移法則の情報が未知の場合には、状態観測と逐次決定により蓄積されていく情報集合に基づいてベイズ統計による推移法則の推定とその推定に基づく最適化モデルが構成され、区間型の最適方程式から評価関数は上限と下限を持つ区間に表現される。今年度は、品質管理におけるマルコフ決定モデルに関して、ベイズアプローチによる故障発生分布のパラメータに対する学習理論と適応政策の最適性の研究に取り組み推定制御による適応手法を明らかにした。また、システムの特性的パラメータが区分的に変化し得る一般的なマルコフモデルにおける最適制御の理論研究やシステム状態を間接的な観測情報から推定し逐次意思決定を行うモデルである部分観測可能なマルコフ決定過程における問題として、学習プロセスと逐次決定に対するベイズ的解析手法の研究へも取り組み、実際的応用としての品質管理モデル等への適用について共同研究セミナーを実施し今後の課題解決に向けて問題点の整理や既存研究からの展開に取り組んでいる。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 推移法則未知のマルコフ決定過程において、品質管理モデルへのベイズアプローチによるパラメータの学習理論と適応政策の最適性について推定制御による適応手法を明らかにした。この数理モデルの拡張にさらに取り組むとともに、また、システムの特性的パラメータが区分的に変化し得る一般的なマルコフモデルにおける最適制御の理論研究や、システム状態を間接的な観測情報から推定し逐次意思決定を行うモデルである部分観測可能なマルコフ決定過程における問題として、学習プロセスと逐次決定に対するベイズ的解析手法の研究へも取り組み共同研究を進めている。適宜、成果発表やセミナーでの研究討議を行い課題解決に取り組んでおり本研究の目的は順調に進展している。
Strategy for Future Research Activity	これまでの研究計画・方法を継続して進めると同時に、研究成果をまとめて各種の研究集会、学会、国際会議等で発表する。具体的には、（１）区間推定MDPモデルについて、完全情報下でのモデルとの比較から情報価値の評価に取り組む。また、未知情報を含む停止決定過程について、その区間推定最適化モデルの構築を目指す。（２）適応的政策の構成など不確実性の下でのマルコフ決定過程の制御問題についてその学習理論の研究に取り組む。また、アルゴリズムの開発では、実用的な実行可能性にも配慮し効率的な逐次近似アルゴリズムの構築に取り組む。（３）実際的な経済・社会問題に適用可能なモデル研究として、引き続き品質管理問題や支出問題の研究に取り組む。
Causes of Carryover	旅費支出に関して予定の変更で残額が生じ次年度に繰り越すこととした。
Expenditure Plan for Carryover Budget	主に次年度の旅費として計画的に使用する。

Research Products

(6 results)

All 2016 2015 Other

All Int'l Joint Research (2 results) Journal Article (3 results) Presentation (1 results)

[Int'l Joint Research] University of Liverpool(英国)
- Country Name
  UNITED KINGDOM
- Counterpart Institution
  University of Liverpool
[Int'l Joint Research] Universite de Bordeaux(フランス)
- Country Name
  FRANCE
- Counterpart Institution
  Universite de Bordeaux
[Journal Article] 多変量ベイズ管理図の適応手法(II)2015
- Author(s)
  堀口正之
- Journal Title
  
  京都大学数理解析研究所講究録1939「不確実性の下での数理モデルとその周辺」
  
  Volume: 1939 Pages: 152,161
[Journal Article] “Bayesian Inference in Markov Decision Processes.”2015
- Author(s)
  M. Horiguchi
- Journal Title
  
  Modern Trends in Controlled Stochastic Processes: Theory and Applications, Vol. 2 (A.B. Piunovskiy ed.), Luniver Press
  
  Volume: Vol. 2 Pages: 177,189
[Journal Article] マルコフ決定過程における学習プロセスと決定について2015
- Author(s)
  中井達
- Journal Title
  
  京都大学数理解析研究所講究録1939「不確実性の下での数理モデルとその周辺」
  
  Volume: 1939 Pages: 79,87
[Presentation] Optimal Stopping problem in uncertain Markov Decision Processes2016
- Author(s)
  M. Horiguchi and A.B. Piunovskiy
- Organizer
  日本数学会2016年度年会
- Place of Presentation
  筑波大学
- Year and Date
  2016-03-18

2015 Fiscal Year Research-status Report

推移確率行列未知のマルコフ決定過程の研究

Principal Investigator

堀口 正之 神奈川大学, 理学部, 教授 (90366401)

Current Status of Research Progress

Reason

Research Products

[Int'l Joint Research] University of Liverpool(英国)

Country Name

Counterpart Institution

[Int'l Joint Research] Universite de Bordeaux(フランス)

Country Name

Counterpart Institution

[Journal Article] 多変量ベイズ管理図の適応手法(II)2015

Author(s)

Journal Title

[Journal Article] “Bayesian Inference in Markov Decision Processes.”2015

Author(s)

Journal Title

[Journal Article] マルコフ決定過程における学習プロセスと決定について2015

Author(s)

Journal Title

[Presentation] Optimal Stopping problem in uncertain Markov Decision Processes2016

Author(s)

Organizer

Place of Presentation

Year and Date

堀口正之神奈川大学, 理学部, 教授 (90366401)