• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2000 Fiscal Year Annual Research Report

一般効用化数をもつ確率的決定過程の最適化理論とその応用に関する研究

Research Project

Project/Area Number 11640118
Research InstitutionWakayama Univ.

Principal Investigator

門田 良信  和歌山大学, 教育学部, 教授 (90116294)

Co-Investigator(Kenkyū-buntansha) 安田 正實  千葉大学, 理学部, 教授 (00041244)
蔵野 正実  千葉大学, 教育学部, 教授 (70029487)
KeywordsMarkov / decision / stopping / utility / optimal / concave / risk-averse / non-discounted
Research Abstract

マルコフ決定過程(S,A,q,r)を,Sは可算状態空間,Aはコンパクト決定空間,q=(q_<ij>(a))(i,j∈S,a∈A)はa∈Aについて連続な推移確率,r(i,a,j)はa∈Aについて連続で一様有界な利得とする。X_t,Δ_tを時刻tの状態と決定を表す確率変数とする。X_k,Δ_k,0【less than or equal】k【less than or equal】t-1とX_tに関するA上の条件付き確率のtに関する列を政策とよびπと表す。また,非負整数値確率変数σを停止時刻とする。
B(t)=Σ^t_<k=1>r(X_<k-1>,Δ_<k-1>,X_k)とする。初期状態i_0に対して標本空間Ω=(S×A)^∞上の確率P^π_<i0>が定まる。この確率による期待値をE^π_<i0>で表す。初期資産をα_0としてE^π_<i0>[g(α^0+β(σ))]を最大化する(π,σ)を(i_0,α_0)最適なペアとよぶ。ここで効用関数gは(非減少,凹,上に有界),または(実数のコンパクト集合上で有界な導関数をもち任意のπ,iについてE^π_i[sup_<t【greater than or equal】0>g^+(α^0+β(t))]<∞とする。ただし,g^+はgの正値部分とする。)任意のi∈Sと実数αについて,ν(i,α)=max^<{(π,σ)}>E^π_i(g(α+B(t))とおく。このとき,最適なペアと最適方程式の間に次の関係がある。
(i)任意のi∈Sとαに対してυ(i,α)は最適方程式
ν(i,α)=max{g(α),max_<α∈A>Σ_<j∈S>q_<ij>(α)ν(j,α+γ(i,a,j))} (1)を満たす。さらに(π,σ)をP^π_<i_0>(σ【greater than or equal】1)=1とする。
(ii)(π,σ)が(i_0,α_0)最適なペアならばυ(i_0,α_0)=E^π_i(g(α+B(t))は(1)を満たす。
(iii)逆に,E^π_i(g(α+B(t))=υ(i_0,α_0)が(1)を満たせば,(π,σ)は(i_0,α_0)最適なペアとなる。

  • Research Products

    (3 results)

All Other

All Publications (3 results)

  • [Publications] Y.Kadota,M.Kurano and M.Yasuda.: "Stopped decision processes in conjunction with general utility."To appear in J.Information and Optimization Science.. (2001)

  • [Publications] Y.Kadota,M.Kurano and M.Yasuda: "Risk-averse stopped Markov decision processes"第4回情報・統計科学(BIC)シンポジウム報告.. (1999)

  • [Publications] Y.Kadota.: "Deviation matrix,Laurent series and Blackwell optimality in countable state Markov decision processes."数理解析研究所講究録「不確実なモデルによる動的計画理論の課題とその展望」. (掲載予定)(某雑誌に掲載予定). (2001)

URL: 

Published: 2002-04-03   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi