2010 年度実績報告書

非線形な確率動的決定過程における不変埋め込み法による理論構築

研究課題

研究課題/領域番号	21540132
研究機関	高知大学
研究代表者	大坪義夫高知大学, 教育研究部・自然科学系, 教授 (20136360)
研究分担者	安田正實千葉大学, 理学研究科, 教授 (00041244)
キーワード	マルコフ決定過程 / 最適政策 / 零和停止ゲーム / 最適方程式
研究概要	研究実施計画に従って,次の研究成果を得た 1.研究代表者は,目標集合を伴うセミマルコフ決定過程におけるリスク最小化問題を導入し,再帰クラスを伴う決定過程として定式化した.目標集合が吸収的であるとき,最適値関数が非線形な最適方程式の一意解であることを示した.また,最適値関数を値反復法で求めるとともに,最適定常政策の存在を与え,最適政策を求めるために政策改良法を導入した,さらに最適閾値確率は分布関数であること示し,これに対応する期待値が従来の概念による初期閾値に依存しない古典的マルコフ決定過程の期待値より大きいことを明らかにした.この成果は論文としてまとめ,発表した 2.研究代表者は,閾値確率を評価関数にもつ離散時間確率過程上の零和停止ゲームにおいて,ゲームの値関数が最適再帰方程式の一意解であること示し,鞍部点の特徴付けを行った.また,独立な確率変数列のモデルに応用し,ゲームの値関数と鞍部点を陽に求めた.この成果は論文としてまとめ,発表したなお,連携研究者の岩本誠一は,フィボナッチ2次方程式として知られている黄金比2次方程式の一般形を考え,固有値問題との関連を研究した.吉田祐治は,意志決定問題において重み付き集約作用素で与えられた効用関数を考え,変換不変量との関連を研究した.これらの成果は論文として発表された

研究成果
(3件)

すべて 2010

すべて雑誌論文 (2件) (うち査読あり 1件) 学会発表 (1件)

[雑誌論文] Optimal threshold probability and expectation in semi-Markov decision processes2010
- 著者名/発表者名
  Masahiko Sakaguchi, Yoshio Ohtsubo
- 雑誌名
  
  Applied Mathematics and Computation
  
  巻: Vol.216, No.10 ページ: 2947-2958
- 査読あり
[雑誌論文] Zero-sum stopping game associated with threshold probability2010
- 著者名/発表者名
  Yoshio Ohtsubo
- 雑誌名
  
  "Stochastic Control", Edited by Chris Myers, Sciyo.com
  
  ページ: 81-86
[学会発表] Optimal threshold probability and expectation in Markov decision processes2010
- 著者名/発表者名
  阪口昌彦, 大坪義夫
- 学会等名
  日本数学会秋季総合分科会
- 発表場所
  名古屋大学
- 年月日
  2010-09-23

2010 年度 実績報告書

非線形な確率動的決定過程における不変埋め込み法による理論構築

研究代表者

大坪 義夫 高知大学, 教育研究部・自然科学系, 教授 (20136360)

研究成果

[雑誌論文] Optimal threshold probability and expectation in semi-Markov decision processes2010

著者名/発表者名

雑誌名

[雑誌論文] Zero-sum stopping game associated with threshold probability2010

著者名/発表者名

雑誌名

[学会発表] Optimal threshold probability and expectation in Markov decision processes2010

著者名/発表者名

学会等名

発表場所

年月日

2010 年度実績報告書

大坪義夫高知大学, 教育研究部・自然科学系, 教授 (20136360)