• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

一般効用関数をもつ確率的決定過程の最適化理論とその応用に関する研究

研究課題

研究課題/領域番号 11640118
研究種目

基盤研究(C)

配分区分補助金
応募区分一般
研究分野 数学一般(含確率論・統計数学)
研究機関和歌山大学

研究代表者

門田 良信  和歌山大学, 教育学部, 教授 (90116294)

研究分担者 安田 正實  千葉大学, 理学部, 教授 (00041244)
蔵野 正実 (蔵野 正美)  千葉大学, 教育学部, 教授 (70029487)
研究期間 (年度) 1999 – 2000
研究課題ステータス 完了 (2000年度)
配分額 *注記
1,400千円 (直接経費: 1,400千円)
2000年度: 700千円 (直接経費: 700千円)
1999年度: 700千円 (直接経費: 700千円)
キーワードMarkov / decision / stopping / utility / optimal / concave / risk-averse / non-discounted
研究概要

マルコフ決定過程(S,A,q,r)を,Sは可算状態空間,Aはコンパクト決定空間,q=(qij(a))(i,j∈S,a∈A)はa∈Aについて連続な推移確率,r(i,a,j)はα∈Aについて連続で一様有界な利得とする。X_t,Δ_tを時刻tの状態と決定を表す確率変数とする。X_k,Δ_k,0【less than or equal】k【less than or equal】t-1とX_tに関するA上の条件付き確率のtに関する列を政策とよびπと表す。また,非負整数値確率変数σを停止時刻とする。
B(t)=Σ^t_k=_1r(X_<k-1>,Δ_<k-1>,X_k)とする。初期状態i_0に対して標本空間Ω=(S×A)^∞上の確率P^π_<i_0>が定まる。この確率による期待値をE^π_<i_0>で表す。初期資産をα_0としてE^π_<i_0>[g(α_0+B(σ))]を最大化する(π,σ)を(i_0,α_0)最適なペアとよぶ。ここで効用関数gは(非減少,凹,上に有界),または(実数のコンパクト集合上で有界な導関数をもち任意のπ,iについてE^π_i[sup_<t【greater than or equal】0>g^+(α_0+B(t))]<∞とする。ただし,g^+はgの正値部分とする。)任意のi∈Sと実数αについて,υ(i,α)=max_<{(π,σ)}>E^π_i(g(α+B(σ))とおく。このとき,最適なペアと最適方程式の間に次の関係がある。
(i)任意のi∈Sとαに対してυ(i,α)は最適方程式
υ(i,α)=max{g(α),max_<α∈A>Σ_<j∈S>qij(a)υ(j,α+r(i,a,j))}(1)
を満たす。さらに(π,σ)をP^π_<i_0>(σ【greater than or equal】1)=1とする。
(ii)(π,σ)が(i_0,α_0)最適なペアならばυ(i_0,α_0)=E^π_<i_0>[g(α_0+B(σ))]は(1)を満たす。
(iii)逆に,E^π_<i_0>[g(α_0+B(σ))]=υ(i_0,α_0)が(1)を満たせば,(π,σ)は(i_0,α_0)最適なペアとなる。

報告書

(3件)
  • 2000 実績報告書   研究成果報告書概要
  • 1999 実績報告書
  • 研究成果

    (10件)

すべて その他

すべて 文献書誌 (10件)

  • [文献書誌] Y.Kadota,M.Kurano and M.Yasuda.: "Stopped decision processes in conjunction with general utility."To appear in J.Information and Optimization Science.. (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota,M.Kurano and M.Yasuda: "Risk-averse stopped Markov decision processes"第4回情報・統計科学(BIC)シンポジウム報告.. (1999)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota.: "Deviation matrix, Laurent series and Blackwell optimality in countable state Markov decision processes."数理解析研究所講究録「不確実なモデルによる動的形画理論の課題とその展望」. (掲載予定). (2001)

    • 説明
      「研究成果報告書概要(和文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota, M.Kurano and M.Yasuda: "Stopped decision processes in conjunction with general utility."To appear in J.Inform. & Optim.Sci.. (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota, M.Kurano and M.Yasuda: "Risk-averse stopped Markov decision processes."The 4th BIC (Bull. Inform. & Cybernet.) symposium. (1999)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota: "Deviation matrix, Laurent series and Blackwell optimality in countable state Markov decision Processes."To appear. Lecture note in Institute of Math. Anal. in Kyoto Univ.. (2001)

    • 説明
      「研究成果報告書概要(欧文)」より
    • 関連する報告書
      2000 研究成果報告書概要
  • [文献書誌] Y.Kadota,M.Kurano and M.Yasuda.: "Stopped decision processes in conjunction with general utility."To appear in J.Information and Optimization Science.. (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Y.Kadota,M.Kurano and M.Yasuda: "Risk-averse stopped Markov decision processes"第4回情報・統計科学(BIC)シンポジウム報告.. (1999)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Y.Kadota.: "Deviation matrix,Laurent series and Blackwell optimality in countable state Markov decision processes."数理解析研究所講究録「不確実なモデルによる動的計画理論の課題とその展望」. (掲載予定)(某雑誌に掲載予定). (2001)

    • 関連する報告書
      2000 実績報告書
  • [文献書誌] Y.Kadota,M.Kurano,M.Yasuda: "Stopped Decision Processes in conjunction with General Utility"Accepted to Jounal of Information & Optimization Sciences..

    • 関連する報告書
      1999 実績報告書

URL: 

公開日: 1999-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi