• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2020 年度 実施状況報告書

多価確率微分方程式に対する確率制御理論の構築と展開

研究課題

研究課題/領域番号 20K03754
研究機関広島市立大学

研究代表者

田中 輝雄  広島市立大学, 情報科学研究科, 教授 (80227149)

研究期間 (年度) 2020-04-01 – 2023-03-31
キーワード集合値確率過程 / マルコフ過程
研究実績の概要

一般に確率制御理論では、制御過程、状態過程、評価関数の3 要素が重要である。従来研究は、制御過程はスカラー値又はベクトル値確率過程、状態過程は制御過程を変数として含む確率微分方程式で記述されるスカラー値又はベクトル値確率過程、評価関数は制御過程と状態過程に依存する汎関数(スカラー値確率変数)の期待値によって定式化を与え、最適制御の存在を証明し、最適値関数の特徴付けを行うことであった。本研究は、制御過程を集合値確率過程、状態過程を制御過程を変数として含む確率微分包含方程式又は集合値確率微分方程式で記述される確率過程、評価関数を制御過程と状態過程に依存する集合値関数(集合値確率変数)の期待値によって定式化を与え、最適制御の存在を証明し、最適値関数の特徴付けを行うことである。そのために、コンパクト凸集合値確率過程に対して以下の基本事項について研究を行った。コンパクト凸集合族をBanach空間に埋め込むベクトル化の手法を用いると、コンパクト凸集合を値としてもつ集合値確率変数(多価確率変数)は、Banach空間に値をとるベクトル値確率変数(一価確率変数)とみなすことができる。この事柄を用いて、集合値マルコフ過程の考察を行った。集合値状態に依存する集合値条件付期待値の定義、離散時間変数をもつ集合値確率過程のシフト作用素の定義、離散時間変数をもつ集合値マルコフ連鎖の定義等を与え、離散時間変数をもつ集合値マルコフ連鎖が強マルコフ性を有することを示した。これらの研究に基づき、連続時間変数をもつ集合値マルコフ過程の定義、連続時間変数をもつ集合値マルコフ過程の強マルコフ性を定義、連続時間変数をもつ集合値マルコフ過程の標本路の準左連続性を与え、強マルコフ性を有するための十分条件を考察した。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

Artstein, Z.(On the calculus of closed set-valued functions, Indiana Univ. Math. J., pp.433-441, 1974)、Debreu, G.(Integration of correspondences, Proc.5th Berkeley symposium on Math.Stat.Prob., 1967)、Radstrom, H.(An embedding theorem for spaces of convex sets, Proc.Amer.Math.Soc., pp.165-169, 1952)などの先行研究により集合値関数の積分をBanach空間値関数の積分に帰着できるという着想を得たためと考えられる.

今後の研究の推進方策

コンパクト凸集合族をBanach空間に埋め込むベクトル化の手法を用いることなく、つまり、コンパクト凸集合を値としてもつ集合値確率変数をBanach空間に値をとるベクトル値確率変数とみなすことなく、集合値ということを活かして、集合値マルコフ過程について考察する。さらに、集合値確率過程の確率微分方程式や確率制御理論への応用に取り組む。具体的には、確率微分包含方程式・集合値確率微分方程式に対する最適停止問題の定式化を与え、最適停止規則と最適値関数の特徴付けを行う。また、確率微分包含方程式・集合値確率微分方程式に対する連続的制御問題の定式化を与え、最適制御の存在を証明し、最適値関数の特徴付けを行う。

次年度使用額が生じた理由

令和2年度の物品費(集合値解析学関連図書、確率過程関連図書などの購入費)において45円の残額が生じた。令和3年度には、物品費(集合値解析学関連図書、確率微分方程式関連図書、確率制御関連図書などの購入費)に使用する。

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi