2010 Fiscal Year Annual Research Report
非線形な確率動的決定過程における不変埋め込み法による理論構築
Project/Area Number |
21540132
|
Research Institution | Kochi University |
Principal Investigator |
大坪 義夫 高知大学, 教育研究部・自然科学系, 教授 (20136360)
|
Co-Investigator(Kenkyū-buntansha) |
安田 正實 千葉大学, 理学研究科, 教授 (00041244)
|
Keywords | マルコフ決定過程 / 最適政策 / 零和停止ゲーム / 最適方程式 |
Research Abstract |
研究実施計画に従って,次の研究成果を得た 1.研究代表者は,目標集合を伴うセミマルコフ決定過程におけるリスク最小化問題を導入し,再帰クラスを伴う決定過程として定式化した.目標集合が吸収的であるとき,最適値関数が非線形な最適方程式の一意解であることを示した.また,最適値関数を値反復法で求めるとともに,最適定常政策の存在を与え,最適政策を求めるために政策改良法を導入した,さらに最適閾値確率は分布関数であること示し,これに対応する期待値が従来の概念による初期閾値に依存しない古典的マルコフ決定過程の期待値より大きいことを明らかにした.この成果は論文としてまとめ,発表した 2.研究代表者は,閾値確率を評価関数にもつ離散時間確率過程上の零和停止ゲームにおいて,ゲームの値関数が最適再帰方程式の一意解であること示し,鞍部点の特徴付けを行った.また,独立な確率変数列のモデルに応用し,ゲームの値関数と鞍部点を陽に求めた.この成果は論文としてまとめ,発表した なお,連携研究者の岩本誠一は,フィボナッチ2次方程式として知られている黄金比2次方程式の一般形を考え,固有値問題との関連を研究した.吉田祐治は,意志決定問題において重み付き集約作用素で与えられた効用関数を考え,変換不変量との関連を研究した.これらの成果は論文として発表された
|
Research Products
(3 results)