研究課題/領域番号 |
17K05362
|
研究機関 | 大阪大学 |
研究代表者 |
貝瀬 秀裕 大阪大学, 基礎工学研究科, 准教授 (60377778)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 決定論的制御 / 確率制御 / 動的計画法 / 非線形偏微分方程式 / 粘性解 |
研究実績の概要 |
前年度に引き続き、経路依存システムにおける微分ゲームに現れる経路依存型Isaacs偏微分方程式が2次増大の非線形性を持つ場合に、解の離散時間近似の研究を行った。前年度までの研究結果は、システムやコストにL2連続性を課していたため、応用上しばしば現れる離散時間遅れやランニング・マキシマムに依存する場合が含まれていなかった。今年度は上述のケースを含むL∞連続性まで条件を緩和して、離散時間値関数が経路依存型Isaacs偏微分方程式の一意的な粘性解に収束することを証明した。これにより、多様な経路依存構造を持つシステムに対するIsaacs方程式の近似理論の基礎が与えられた。さらにマルコフ的システムにおける線形2次制御を基盤とする冪等代数的手法を経路依存システムに対して発展させることで、現実的に実行可能な数値スキームの開発が見込まれる。
連続時間経路依存型確率制御の研究は、後退確率微分方程式や経路依存型粘性解などの先端的理論が必要となり、経路依存型リスク鋭感的確率制御の研究に必要なそれらの理論は発展途上である。まずは経路依存型リスク鋭感的制御における動的構造を見極めるため離散時間問題を考えた。以前行っていた未完の部分可観測問題を再考し、部分可観測離散時間経路依存型リスク鋭感的制御問題をinformation stateと呼ばれる十分統計量に関する完全可観測問題として定式化できることを示した。経路依存型リスク鋭感的確率制御における離散時間ダイナミクスの発見は、今後行う予定の連続時間問題の研究に大きな知見を与えると考えられる。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
経路依存システムに対する正則性をより一般的な正則性まで緩和することができ、決定論的経路依存型動的計画方程式の研究は予想以上に進展している。一方、前出の研究に時間を費やしたため、冪等代数的手法やリスク鋭感的確率制御の研究の準備・開始に若干の遅れを生じている。
|
今後の研究の推進方策 |
連続時間経路依存型リスク鋭感的確率制御の研究を開始する。まずは2次増大後退確率微分方程式の最新の知見がリスク鋭感的確率制御問題に適用可能かどうかを吟味し、先行研究の拡張を試みる。また、2階経路依存型偏微分方程式の粘性解理論の最近の発展を踏まえ、経路依存型リスク鋭感的確率制御に現れる経路依存型Bellman方程式の解析的な特徴付けに関する研究を行う。
前年度までに決定論的経路依存型動的計画偏微分方程式の離散時間近似に関する基礎理論を構築した。経路依存型線形2次制御の明示解を利用した経路依存型動的偏微分方程式に対する冪等的手法の可能性を探る。
|
次年度使用額が生じた理由 |
冪等的手法の研究のなどの遅れに関連し、購入予定の計算機の調達が遅れたため使用額に差額が生じた。翌年度、計算機を購入し関連する研究を進める。
|