2013 Fiscal Year Annual Research Report
Project/Area Number |
23740069
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
中野 張 東京工業大学, 大学院イノベーションマネジメント研究科, 准教授 (00452409)
|
Keywords | 確率制御 / ハミルトン・ヤコビ・ベルマン方程式 |
Research Abstract |
本年度は、連続時間確率制御問題に付随するハミルトン・ヤコビ・ベルマン(HJB)方程式の数値解析の研究を実施した。制御システムが線形の場合にはHJB方程式の解は状態変数の2次関数として表されることが知られており、この点を加味して、本研究ではHJB方程式の解の2次近似アルゴリズムを導出し、その厳密な誤差評価を行った。まず被制御過程に制御変数付きのオイラー・丸山近似を適用することによりHJB方程式の時間離散化を行い、各時間ステップにおける値関数の2次近似の剰余項を評価した。時間離散化においては、Krylovによる軟化子を用いる手法を採用し、片側の誤差が時間ステップの1/4乗のオーダーであることを示した。さらに、方程式全体の誤差については、時間離散化誤差と空間変数に関する2次近似誤差、および2次近似を評価する領域の半径の逆数に分解できることを示し、これにより、各時間ステップの2次近似が広い領域で上手くいけばいくほど方程式の解の精度も高くなるという直感にも整合する結果が得られた。この2次近似法をいくつかの具体例に適用し、精度と使いやすさを数値的に検証した。その結果、実装は非常に容易で高い計算速度を持つこと、および境界条件が2次関数的であるときには精度が良いことが確かめられた。ゆえに、次元が高い実際上の問題に対しても適用可能であることが示唆される。以上の成果を一編の論文としてまとめ、学術雑誌に投稿中である。
|