本研究ではまず,確率解析と統計力学に基づく非線形確率最適制御問題に対する反復解法を構築し,真の解に収束するための条件を明らかにした.提案手法により,これまで十分な解法がなかった非線形確率最適制御問題に対して最適フィードバック入力を得ることが可能となった.つぎに,この方法を利用して確定非線形最適制御問題の確率的な学習による解法を提案した.本手法により,試行実験の反復を行いながら,人工的に加えたノイズの共分散を零としていく極限において,確定最適制御問題の最適フィードバック入力の近似解が得られる.さらに,ロボットマニピュレータを用いた実機検証により提案手法の効果を確認した.
|