研究概要 |
1 本研究の月的は(1)線形システムの係数がマルコフ連鎖に従うとき,確率線形システムの安定条件を明らかにする. (2)確率線形システムが可安定であるとき,適当な評価関数を最適にする最適制御方策と非線形DP方程式の粘性解との関係を明らかにする。 (3)ランダム・パラメータを含む確立微分方程式の解を求めるアルゴリズムを作る. 2 昨年度は線形システムのランダム・パラメータがマルコフ連鎖に従うシステムをマルコフ過程で定式化し,システムの確率的安定性について調べた.特に,指数型マルチンゲールと確率微分方程式の「ずれの変換」との関係について研究した.マルチンゲールの指数関数がマルチンゲールとなる指数型マルチンゲールを用いて測度変換を行うと確率微分方程式のドリフト項が変化する.この方法を線形システムのランダム・パラメータがマルコフ連鎖に従うシステムの解析に利用する方法について考えた. 3 今年度はランダム・パラメータがマルコフ連鎖に従う場合,マルコフ連鎖の推移確立を実現値を用いて学習するQ-learningについて研究し,その成果を数理解析研究所講究録「不確実性の下での意思決定の数理」に発表した.
|