• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

確率的変分問題の離散化とスケール極限

Research Project

Project/Area Number 18K03343
Research InstitutionAoyama Gakuin University

Principal Investigator

市原 直幸  青山学院大学, 理工学部, 准教授 (70452563)

Project Period (FY) 2018-04-01 – 2023-03-31
Keywordsマルコフ決定過程 / 割引因子 / ベルマン方程式
Outline of Annual Research Achievements

本年度は、確率的変分問題の離散版に対応するマルコフ決定過程として、Kullback-Leiblerダイバージェンスを費用関数に持つ有限状態マルコフ決定過程を扱った。具体的には、割引因子と吸収状態を持つ無限期間マルコフ決定過程に対する割引因子消滅極限を考察した。特に、割引因子を限りなく1に近づけたときの値関数の漸近挙動をベルマン方程式と呼ばれる差分方程式の解の言葉で特徴付けるとともに、極限における最適軌道の振る舞いについて詳しく調べた。
得られた成果は以下のとおりである。まず、λが正のときは、値関数は吸収状態を持たない長時間平均型のマルコフ決定過程に対応するベルマン方程式の解に収束することがわかった。次に、λが負のときは、値関数は吸収状態で停止するマルコフ決定過程に対応するベルマン方程式の解に収束することがわかった。また、これら2つの場合とは異なり、λが0のときは値関数は無限大に発散することが示された。特に、λが0の場合については発散する増大度に関する評価式を得た。
これらの結果から、割引因子を限りなく1に近づけたときの値関数の漸近挙動は、対応する長時間平均型のマルコフ決定過程に対する最適値λに大きく依存することがわかった。なお、吸収状態がない場合はλの値に関わらず値関数は長時間平均型のマルコフ決定過程に対応するベルマン方程式の解に収束することが知られており、上記の結果は吸収状態の存在に起因する現象であることがわかった。

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

新型コロナウイルス感染症の世界的流行により、当該年度に実施を予定していた国際共同研究に影響が出たため。

Strategy for Future Research Activity

今年度の成果を踏まえて、状態空間がコンパクトでない場合のマルコフ決定過程に対する割引因子消滅極限を考察する。また、連続型の確率的変分問題との共通点や相違点を調べる。

Causes of Carryover

新型コロナウイルス感染症の世界的流行により、予定されていた国内外の出張が全てキャンセルされたため。未使用分は次年度における旅費として使用する予定である。

  • Research Products

    (3 results)

All 2022 2021 Other

All Journal Article (1 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 1 results) Presentation (1 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results) Remarks (1 results)

  • [Journal Article] Sharp estimates of the generalized principal eigenvalue for superlinear viscous Hamilton-Jacobi equations with inward drift2022

    • Author(s)
      Chasseigne Emmanuel、Ichihara Naoyuki
    • Journal Title

      Nonlinear Differential Equations and Applications NoDEA

      Volume: 29 Pages: -

    • DOI

      10.1007/s00030-022-00769-0

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] Ergodicity of optimal feedback diffusions for stochastic ergodic control problems with inward drift2021

    • Author(s)
      Naoyuki Ichihara
    • Organizer
      The 53rd ISCIE International Symposium on Stochastic Systems Theory and Its Applications (SSS '21)
    • Int'l Joint Research / Invited
  • [Remarks] Naoyuki Ichihara's website

    • URL

      https://sites.google.com/site/naoyukiichihara/home?authuser=0

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi