研究課題
最終年度は,前年度から引き続き「提案手法のモデルフリー学習制御への拡張」と「提案手法の実機検証.特に歩行ロボットを用いた最適歩行軌道生成問題への適用」に取り組んだ.一つ目の目標に対しては,前年度までに構築した反復型経路積分法を基に,モデルを用いない最適制御問題の学習的解法を提案した.提案手法は,確定非線形最適制御問題に対する確率的な学習による解法を与える.二つ目の目標に対しては,前年度までに構築した単体のシリアルサーボモータのトルク制御システムを,歩行ロボットを想定した複数個のモータに拡張した.しかし,学習途中の転倒の頻発が原因で歩行ロボットに対する学習は達成できなかったため,同システムを用いて別途ロボットマニピュレータを製作し,転倒の影響を排除して実機試験を行うこととした.このシステムに対しては,学習の効果を確認することができ,目標軌道へ追従する入力トルクを獲得した.研究期間全体の成果として,まず確率解析と統計力学に基づく非線形確率最適制御問題の反復解法を構築し,真の解に収束するための条件を明らかにした.提案手法により,これまで十分な解法がなかった非線形確率最適制御問題に対して最適フィードバック入力を得ることが可能となった.二つ目に,この方法を利用して確定非線形最適制御問題の確率的な学習による解法を提案した.本手法により,試行実験の反復を行いながら,人工的に加えたノイズの共分散を零としていく極限において,確定最適制御問題の最適フィードバック入力の近似解が得られる.真の解に収束するためのノイズの共分散の収束速度に関する条件は本研究期間内では得られなかったため,理論的な課題はまだ残るが,ロボットマニピュレータを用いた実験においては有効性が確認できた.三つ目に,トルク制御可能なシリアルサーボモータを用いてロボットマニピュレータを作成し,提案手法の効果を実機検証により確認した.
すべて 2015 2014 その他
すべて 雑誌論文 (2件) (うち査読あり 2件、 謝辞記載あり 1件) 学会発表 (16件) (うち招待講演 1件) 備考 (2件)
SICE Journal of Control, Measurement, and System Integration
巻: 8 ページ: 181-187
http://doi.org/10.9746/jcmsi.8.181
システム制御情報学会論文誌
巻: 27 ページ: 443-451
http://home.hiroshima-u.ac.jp/satoh/index_ja.html
http://home.hiroshima-u.ac.jp/satoh/index.html