研究課題/領域番号 |
20K03754
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分12040:応用数学および統計数学関連
|
研究機関 | 広島市立大学 |
研究代表者 |
田中 輝雄 広島市立大学, 情報科学研究科, 教授 (80227149)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
研究課題ステータス |
完了 (2022年度)
|
配分額 *注記 |
1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
|
キーワード | 集合値確率過程 / 確率制御問題 / マルコフ決定過程 / 最適停止問題 / 分数型評価基準 / 預言者の不等式 / 最適政策 / 最適停止規則 / パラメトリック法 / Dinkebachアルゴリズム / 多価確率微分方程式 / マルコフ過程 / 確率制御理論 / 集合値解析学 |
研究開始時の研究の概要 |
確率制御理論では、制御過程、状態過程、評価関数の3要素が重要である。本研究では、制御過程を集合値確率過程、状態過程を多価確率微分方程式、評価関数を制御過程と状態過程に依存する集合値関数(集合値確率変数)の期待値とすることにより新たな制御問題の定式化を与える。最適制御の存在を証明し、最適値関数の特徴付けを行うことにより、集合値確率制御理論を構築し、さらに、状態制約をもつ確率制御問題、不規則集合移動体の最適探索問題等へ応用する。
|
研究成果の概要 |
(1)コンパクト凸集合値確率過程に対して,コンパクト凸集合族をBanach空間に埋め込むベクトル化手法を用いて,Banach空間値マルコフ過程と同一視し,集合値マルコフ過程の考察を行った. (2)分数型評価関数に対する確率制御問題(マルコフ決定過程,最適停止問題)に対して,最適制御(最適政策,最適停止規則)の存在性と最適値の特徴付けを与え,Dinkelbach アルゴリズムの有効性の考察を行った. (3)多次元時間変数をもつ確率過程に対する最適停止問題の預言者について,差の評価と比の評価を考察し,普遍定数や普遍定数を導くための最適化問題の導出を行った.
|
研究成果の学術的意義や社会的意義 |
確率制御理論では、制御過程、状態過程、評価関数の3要素が重要である。従来研究は、制御過程はスカラー値又はベクトル値確率過程、状態過程は制御過程を変数として含む確率微分方程式で記述されるスカラー値又はベクトル値確率過程評価関数、制御過程と状態過程に依存する汎関数の期待値によって定式化を与え、最適制御の存在を証明し、最適値関数の特徴付けを行うことであった。 本研究は、集合値確率過程の性質を考察すること、評価関数を分数型にすることよって定式化を与え、最適制御の存在を証明し最適値関数の特徴付けを行うこと、および最適停止問題に対する預言者の不等式を考察することである。
|