2016 Fiscal Year Research-status Report
Project/Area Number |
15K04935
|
Research Institution | Aoyama Gakuin University |
Principal Investigator |
市原 直幸 青山学院大学, 理工学部, 准教授 (70452563)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | 確率最適制御 |
Outline of Annual Research Achievements |
今年度は,粘性Hamilton-Jacobi方程式に対する臨界性理論に関連して,その離散版であるMarkov決定過程に対するエルゴード問題を考察した.可算無限集合を状態空間とし,推移確率を制御パラメータとする離散時間のMarkov連鎖に対して,与えられた報酬関数に応じて得られる利得から推移確率を変更することにより発生する費用を差し引いた正味の値の期待値を,長時間平均の意味で最大化する問題(エルゴード問題)を考える.この問題に付随する最適性方程式は非線形差分方程式に対する固有値問題の形をとり,上述のエルゴード問題に対する最適値および最適戦略(最適制御)は,この固有値問題の一般化主固有値と固有関数により特徴付けられることが知られている.今年度の研究では,これらの値を有限時間区間の最適性方程式の解を用いて近似する問題(いわゆるvalue iteration)を考察し,以下の結果を得た. (1)初期関数に対する十分緩い仮定のもとで,固有値問題の一般化主固有値は有限時間区間の解により近似することができる. (2)初期関数をある程度良いクラスから選べば,固有値問題の一般化主固有関数は有限時間区間の解により近似することができる. (3)エルゴード問題が拘束条件を持つ場合,有限時間区間の解は拘束条件を持たない場合とは異なる挙動を示す. これらの結果は,最適化問題の費用関数が特別な場合には,乗法型エルゴード定理と呼ばれる一連の極限定理に対応し,本研究ではその非線形拡張を行ったとみることもできる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
離散型モデルに対する臨界性理論について,新たな発展につながる結果が得られたため.
|
Strategy for Future Research Activity |
粘性Hamilton-Jacobi方程式に対する臨界性理論に関して,方程式にドリフト項が含まれる場合について考察し,これまでに得られた結果の拡張可能性について模索する.
|
Causes of Carryover |
旅費を算出する際の誤差として,次年度使用額が生じた.
|
Expenditure Plan for Carryover Budget |
研究遂行のため,国内外の研究者との研究打ち合わせのために使用する予定である.
|
Research Products
(4 results)