本年度は,部分観測確率制御問題のための数値解析について研究を進めた. 研究計画では,部分観測確率制御を線形確率偏微分方程式と高次元ハミルトン・ヤコビ・ベルマン方程式の2種類の偏微分方程式の近似問題に帰着させることを目標としており, 本年度は,適切なカーネル型関数近似を開発することにより,この目標の達成を試みた.具体的には,連続関数の空間における作用素ノルムが有界となるようなカーネル型関数近似のクラスを開発した.これにより,確率偏微分方程式のカーネル選点法の収束を明快な仮定の下で示すことができた.加えて,反復法によるカーネル型関数近似のクラスの研究を進めた.適当な反復法により大規模逆行列計算が避けられるので,このクラスの関数近似は高次元の問題に適用可能である.これを高次元ハミルトン・ヤコビ・ベルマン方程式の数値解析を応用した.これらの成果は投稿準備中である.本成果は部分観測確率制御問題に対して実装可能な数値解法を提供した初めての研究と位置付けられる.
研究期間全体では,上記の部分観測確率制御問題の他,確率制御問題の逆問題について研究した.これについては逆問題を評価基準における,処罰パラメーターを求める問題として定めた. この枠組みにおいて,適切性が成り立つための十分条件を明らかにした. また数値解法についても検討し,いくつかの具体的な問題に対して,処罰パラメーターが高い精度で再現されることを数値的に確認した. これらの成果を1編の論文としてまとめ現在投稿中である. これまで,確率制御の一般的枠組みにおいて逆問題はほとんど研究されておらず,また,決定論的制御においても逆問題の適切性を議論した論文は無いため,本成果は,最適制御の逆問題という,長年重要視されてきた問題に対し理論的基盤の一つを与えるものと位置付けられる.
|