2014 Fiscal Year Annual Research Report
確率解析と統計力学に基づく非線形確率最適制御の新しい解法と学習への応用
Project/Area Number |
24760338
|
Research Institution | Hiroshima University |
Principal Investigator |
佐藤 訓志 広島大学, 工学(系)研究科(研究院), 助教 (60533643)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 非線形制御 / 確率制御 / 最適制御 |
Outline of Annual Research Achievements |
最終年度は,前年度から引き続き「提案手法のモデルフリー学習制御への拡張」と「提案手法の実機検証.特に歩行ロボットを用いた最適歩行軌道生成問題への適用」に取り組んだ.一つ目の目標に対しては,前年度までに構築した反復型経路積分法を基に,モデルを用いない最適制御問題の学習的解法を提案した.提案手法は,確定非線形最適制御問題に対する確率的な学習による解法を与える.二つ目の目標に対しては,前年度までに構築した単体のシリアルサーボモータのトルク制御システムを,歩行ロボットを想定した複数個のモータに拡張した.しかし,学習途中の転倒の頻発が原因で歩行ロボットに対する学習は達成できなかったため,同システムを用いて別途ロボットマニピュレータを製作し,転倒の影響を排除して実機試験を行うこととした.このシステムに対しては,学習の効果を確認することができ,目標軌道へ追従する入力トルクを獲得した.
研究期間全体の成果として,まず確率解析と統計力学に基づく非線形確率最適制御問題の反復解法を構築し,真の解に収束するための条件を明らかにした.提案手法により,これまで十分な解法がなかった非線形確率最適制御問題に対して最適フィードバック入力を得ることが可能となった.二つ目に,この方法を利用して確定非線形最適制御問題の確率的な学習による解法を提案した.本手法により,試行実験の反復を行いながら,人工的に加えたノイズの共分散を零としていく極限において,確定最適制御問題の最適フィードバック入力の近似解が得られる.真の解に収束するためのノイズの共分散の収束速度に関する条件は本研究期間内では得られなかったため,理論的な課題はまだ残るが,ロボットマニピュレータを用いた実験においては有効性が確認できた.三つ目に,トルク制御可能なシリアルサーボモータを用いてロボットマニピュレータを作成し,提案手法の効果を実機検証により確認した.
|