2017 Fiscal Year Research-status Report
Studies of path-dependent controls by dynamic programming methods
Project/Area Number |
17K05362
|
Research Institution | Osaka University |
Principal Investigator |
貝瀬 秀裕 大阪大学, 基礎工学研究科, 准教授 (60377778)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 確率制御 / 決定論的制御 / 動的計画法 / HJB偏微分方程式 / 粘性解 |
Outline of Annual Research Achievements |
今年度は、経路依存型決定論的制御における動的計画方程式の基礎研究を行った。具体的には経路空間におけるi-smooth calculusやそれに基づく粘性解型の弱解を用いて、応用上重要とされる非有界な制御領域やコストを伴う経路依存型動的計画偏微分方程式の研究を行った。
まずは、微分ゲームにおける経路依存型Isaacs偏微分方程式に対して非線形項が2次増大性を持つ場合、離散時間経路依存動的ゲームが経路依存型Isaacs偏微分方程式の粘性解に収束することを示した。経路依存型Isaacs偏微分方程式は無限次元経路空間上で定義されるため解を求めるのは困難である。一方で離散時間動的ゲームは有限次元空間の問題であるので、本研究は経路依存型方程式の有限次元空間上の近似理論を与える。また、先の2次増大条件は明示解が知られてる線形システムを含むため、この明示解を組み合わせた数値解法への展開が期待される。
また、Mogulskiiの定理や動的重点サンプリング法に関連する経路依存終末コストを持つ変分問題の研究を行った。Mogulskiiの定理に現れる変分問題のLagrangianは凸で、1次より速いスピードで無限大に発散する (super linear)。本研究でLagrangianが凸でsuper linearの場合、経路依存終末コストを持つ変分問題を経路依存型動的計画問題の値関数とみなし、それを経路依存終末条件を持つHamilton-Jacob偏微分方程式の粘性解として特徴づけることに成功した。これにより、Mogulskiiの定理における収束レートを原理的にはHamilton-Jacobi偏微分方程式を通じて解析的な量として計算できる。また動的重点サンプリングに対しては、Hamilton-Jacobi偏微分方程式の(近似)解を用いた動的サンプリングスキームの構成法への道が開ける。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
今年度計画していた非線形項が2次増大を持つ場合の経路依存型動的計画偏微分方程式に関しては、当初想定していた手法により順調に研究成果が得られた。研究集会や国際会議に参加しての情報収集は若干遅れているが、独自に文献等により情報を集めている。
|
Strategy for Future Research Activity |
経路依存型リスク鋭感的確率制御の研究と、経路依存型動的計画方程式の数値解析に向けた研究に重きをおいていく。 経路依存型リスク鋭感的確率制御に研究に対しては後退確率微分方程式の知見が重要である。これに関する情報収集はまだ十分でないが、必要ならば国際会議や研究集会等に参加し情報収集に努めながら研究に着手する。また連続時間問題の理解のため、場合によっては離散時間の問題にも取り組む。 経路依存型動的計画方程式の数値解析には、通常の動的計画方程式と同様にmax-plus的手法が有効であることが期待できる。max-plus代数の研究者と意見交換をしながら、max-plus的手法の可能性を探る。また、max-plus的手法に関連する制御問題も必要に応じて取り組む
|
Causes of Carryover |
当初予定していた情報収集を目的とした研究集会に参加できなかったため、その旅費が計上されなかった。それを埋め合わせるべく今年度は国際会議や研究集会等に多く参加する予定である。
|
Research Products
(3 results)