2012 Fiscal Year Research-status Report
Project/Area Number |
23740069
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
中野 張 東京工業大学, イノベーションマネジメント研究科, 准教授 (00452409)
|
Keywords | 確率制御 |
Research Abstract |
昨年度に引き続き、確率制御問題の数値解法の研究を行った。既存の数値解法については、いわゆる次元の呪いの問題が存在し、例えば有限差分法や有限要素法を用いて高次元の状態空間を持つ問題を解くのは難しい状況である。この問題を解決するため、昨年度は次元に依存しないモンテカルロ法に基づく新手法を開発したが、これは多大な計算時間を要するという問題があった。 そこで本年度は、制御問題に付随するハミルトン・ヤコビ・ベルマン方程式の2次近似法について研究し、新しい数値解法を開発した。この提案手法により、方程式の近似解が解析的に求まるため、高次元の問題であっても高速に解くことが可能になった。数学的な誤差解析により、ハミルトニアンが2次の構造に近ければ近い程、制御問題の近似精度も高いことを証明した。応用として、ある界面の時間発展を求める問題とファイナンスにおける動的ヘッジ問題に適用し、有用性を確認した。以上の成果を1編の論文としてまとめ、学術雑誌に投稿中である。 提案手法は高速に近似解を生成するため、上記の応用のみならず、自動制御の問題、例えば自動車のサスペンション制御、ヘリコプターの着陸の制御や、生物の運動解析、ロボットの設計等、様々な問題に適用可能であり、応用上の大きな展開が期待できる。また、今回の研究は連続時間モデルを対象としているが、同じ接近により離散時間モデルに対して適用可能である。これにより離散的な制御問題、例えばテトリス等のビデオゲームにも応用できるようになる。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
本研究は確率制御理論の応用上の問題の解決を目的とし、不可避な事項として新たな数値解法の開発を大きな研究課題として掲げ研究計画を策定した。具体的な研究目的は連続時間モデル、ジャンプを含むモデルそれぞれに対する数値解法の研究を進めることであった。現在まで連続時間モデルに適用可能な手法の開発は概ね完了し、同じ接近によりジャンプを含むモデルや離散的なモデルに対する近似手法の開発も見込まれることから、本研究は「研究の目的」に照らしておおむね順調に進展していると言える。
|
Strategy for Future Research Activity |
連続時間モデルに対して開発した2次近似法のジャンプモデルや離散時間モデルへの適用について研究する。特に、厳密な誤差評価を行い、各時間ステップにおける動的計画作用素が2次の構造に近ければ近い程、制御問題全体の近似精度が上がることを証明したい。この理論研究の後、現実上の問題に適用し有用性を検証する。
|
Expenditure Plans for the Next FY Research Funding |
該当なし
|
Research Products
(6 results)