研究課題/領域番号 |
17K05359
|
研究機関 | 東京工業大学 |
研究代表者 |
中野 張 東京工業大学, 情報理工学院, 准教授 (00452409)
|
研究期間 (年度) |
2017-04-01 – 2021-03-31
|
キーワード | 確率制御問題 / 逆問題 / ハミルトン・ヤコビ・ベルマン方程式 |
研究実績の概要 |
本年度は,部分観測確率制御問題のための数値解析と確率制御の逆問題について研究を進めた.前者について具体的には,放物型非線形偏微分方程式および確率偏微分方程式の数値解法の研究を行い,ニューラル・ネットワークによる近似法の検討や,カーネル選点法の厳密な収束証明を試みた.カーネル選点法については,回帰による近似の場合に,厳密に収束を証明し,1編の論文としてまとめ現在投稿中である.研究計画では,部分観測確率制御を線形確率偏微分方程式と高次元ハミルトン・ヤコビ・ベルマン方程式の2種類の偏微分方程式の近似問題に帰着させることを予定しており,上記の結果は帰着された偏微分方程式の数値解法の研究として位置付けられる.
後者について具体的には,定式化を行い,逆問題を評価基準における,処罰パラメーターを求める問題として定めた.この枠組みにおいて,適切性が成り立つための十分条件を明らかにした.また数値解法についても検討し,いくつかの具体的な問題に対して,処罰パラメーターが高い精度で再現されることを数値的に確認した.これらの成果を1編の論文としてまとめ現在投稿中である.これまで,確率制御の一般的枠組みにおいて逆問題はほとんど研究されておらず,また,決定論的制御においても逆問題の適切性を議論した論文は無いため,本成果は,最適制御の逆問題という,長年重要視されてきた問題に対し理論的基盤の一つを与えるものと位置付けられる.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究計画の2本柱の一つである,確率制御の逆問題について成果を出すことができたため.
|
今後の研究の推進方策 |
未解決の研究目的である部分観測確率制御問題の数値解析について研究を進める.
|
次年度使用額が生じた理由 |
RA経費として想定していた労働時間と実労働時間に齟齬があり,確認不足でその点に気付かなかったため.翌年度分の助成金もRAなどの人件費として使用する予定です.
|