• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

多価確率微分方程式に対する確率制御理論の構築と展開

研究課題

研究課題/領域番号 20K03754
研究種目

基盤研究(C)

配分区分基金
応募区分一般
審査区分 小区分12040:応用数学および統計数学関連
研究機関広島市立大学

研究代表者

田中 輝雄  広島市立大学, 情報科学研究科, 教授 (80227149)

研究期間 (年度) 2020-04-01 – 2023-03-31
研究課題ステータス 完了 (2022年度)
配分額 *注記
1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
2022年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2021年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
2020年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
キーワード集合値確率過程 / 確率制御問題 / マルコフ決定過程 / 最適停止問題 / 分数型評価基準 / 預言者の不等式 / 最適政策 / 最適停止規則 / パラメトリック法 / Dinkebachアルゴリズム / 多価確率微分方程式 / マルコフ過程 / 確率制御理論 / 集合値解析学
研究開始時の研究の概要

確率制御理論では、制御過程、状態過程、評価関数の3要素が重要である。本研究では、制御過程を集合値確率過程、状態過程を多価確率微分方程式、評価関数を制御過程と状態過程に依存する集合値関数(集合値確率変数)の期待値とすることにより新たな制御問題の定式化を与える。最適制御の存在を証明し、最適値関数の特徴付けを行うことにより、集合値確率制御理論を構築し、さらに、状態制約をもつ確率制御問題、不規則集合移動体の最適探索問題等へ応用する。

研究成果の概要

(1)コンパクト凸集合値確率過程に対して,コンパクト凸集合族をBanach空間に埋め込むベクトル化手法を用いて,Banach空間値マルコフ過程と同一視し,集合値マルコフ過程の考察を行った.
(2)分数型評価関数に対する確率制御問題(マルコフ決定過程,最適停止問題)に対して,最適制御(最適政策,最適停止規則)の存在性と最適値の特徴付けを与え,Dinkelbach アルゴリズムの有効性の考察を行った.
(3)多次元時間変数をもつ確率過程に対する最適停止問題の預言者について,差の評価と比の評価を考察し,普遍定数や普遍定数を導くための最適化問題の導出を行った.

研究成果の学術的意義や社会的意義

確率制御理論では、制御過程、状態過程、評価関数の3要素が重要である。従来研究は、制御過程はスカラー値又はベクトル値確率過程、状態過程は制御過程を変数として含む確率微分方程式で記述されるスカラー値又はベクトル値確率過程評価関数、制御過程と状態過程に依存する汎関数の期待値によって定式化を与え、最適制御の存在を証明し、最適値関数の特徴付けを行うことであった。
本研究は、集合値確率過程の性質を考察すること、評価関数を分数型にすることよって定式化を与え、最適制御の存在を証明し最適値関数の特徴付けを行うこと、および最適停止問題に対する預言者の不等式を考察することである。

報告書

(4件)
  • 2022 実績報告書   研究成果報告書 ( PDF )
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 研究成果

    (7件)

すべて 2023 2022

すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (4件)

  • [雑誌論文] A discrete time Markov decision process with a fractional discounted reward2023

    • 著者名/発表者名
      Teruo Tanaka
    • 雑誌名

      Journal of Information and Optimization Sciences(掲載予定)

      巻: -

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Continuous time optimal stopping problems with fractional rewards2023

    • 著者名/発表者名
      Teruo Tanaka
    • 雑誌名

      Journal of Information and Optimization Sciences(掲載予定)

      巻: -

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [雑誌論文] Discrete time multiparameter optimal stopping problems with fractional rewards2023

    • 著者名/発表者名
      Teruo Tanaka
    • 雑誌名

      Journal of Information and Optimization Sciences(掲載予定)

      巻: -

    • 関連する報告書
      2022 実績報告書
    • 査読あり
  • [学会発表] 最適停止問題の預言者の不等式―差の評価ー2023

    • 著者名/発表者名
      田中輝雄
    • 学会等名
      日本数学会2023年度年会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 最適停止問題の預言者の不等式―比の評価ー2022

    • 著者名/発表者名
      田中輝雄
    • 学会等名
      日本数学会2022年度秋季総合分科会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 分数型ペイオフを持つ微分ゲームについて2022

    • 著者名/発表者名
      朝田智也,田中輝雄
    • 学会等名
      日本オペレーションズ・リサーチ学会2022年春季研究発表会
    • 関連する報告書
      2021 実施状況報告書
  • [学会発表] 分数型評価基準のマルコフ決定過程2022

    • 著者名/発表者名
      田中輝雄
    • 学会等名
      日本数学会2022年度年会
    • 関連する報告書
      2021 実施状況報告書

URL: 

公開日: 2020-04-28   更新日: 2024-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi