2013 Fiscal Year Research-status Report
確率解析と統計力学に基づく非線形確率最適制御の新しい解法と学習への応用
Project/Area Number |
24760338
|
Research Institution | Hiroshima University |
Principal Investigator |
佐藤 訓志 広島大学, 工学(系)研究科(研究院), 助教 (60533643)
|
Keywords | 非線形制御 / 確率制御 / 最適制御 |
Research Abstract |
前年度に構築した手法は,非線形確率最適制御問題を解く際に帰着される,求解が困難な非線形2階偏微分方程式を,特別な指数変換と逐次近似による反復法を導入することで,確率解析により陽に解が得られるコルモゴロフ方程式という特別な方程式に帰着させることができ,これまでに十分な解法が得られていなかった非線形確率最適制御問題に対して系統的な解法を提供できるという大きな利点を有する.前年度までの結果は,計算方法の効率性は考慮しておらず,計算量が多いという課題があった.そこで当該年度は,前年度に構築した手法の並列計算に基づく計算量の削減を一つ目の目標として研究を遂行した.提案手法は,統計力学の手法に基づき多くのサンプルを生成し,個々のサンプルにおける動力学計算を行うことで,変換したコルモゴロフ方程式を解いており,これが計算量の増大の原因であった.当該年度の成果として,提案手法において個々のサンプルは独立に計算することが可能であることに着目し,各サンプルの計算に並列計算を組み込んだ計算方法を構築することで,提案手法の計算量の大幅な削減に成功した. さらに,研究の目的の一つである「提案手法の実機検証,特に歩行ロボットを用いた最適歩行軌道生成問題への適用」を達成するために理論と実践の両面から研究を遂行した.まず理論面における成果として,二次元歩行ロボットモデルの不整地上の最適歩行軌道生成を非線形確率最適制御問題として定式化し,さらに提案手法に基づく解法を与え,数値シミュレーションにおいて有効性を確認した.一方,既存の歩行ロボット製品のほとんどが位置制御のみを想定しているが,提案手法を歩行ロボットへ適用するにはトルク制御が必要となる.そこで実践面における成果として,トルク制御可能なロボットシステム構築のために,トルク制御可能なシリアルモータを選定し,まずはこのモータ単体での制御システムを構築した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該年度は,提案手法の特徴を活かした並列計算に基づく計算法を構築することができた.本手法により,提案手法の課題であった計算量を大幅に削減することができたため.
|
Strategy for Future Research Activity |
今後はこれまでに得られた成果を基に,残りの研究目標である「提案手法のモデルフリー学習制御への拡張」と「提案手法の実機検証,特に歩行ロボットを用いた最適歩行軌道生成問題への適用」の達成を目指す. 一つ目の目標に対して,当該年度までに構築した提案手法をモデルを用いない学習的解法へと拡張する.具体的な方策として,研究代表者のこれまでの結果も利用することを考えている.まず制御対象を確率ハミルトン系に限定する.すると申請者のこれまでの確率ハミルトン系に関する研究結果より,モデル情報を用いずにノイズ下における評価関数の期待値の勾配が計算できるため,これを提案法と組み合わせることで非線形確率最適制御の学習的解法を構築する. もう一つの目標に対しては,当該年度で得られた基礎実験の結果を利用する.すでに単体のシリアルモータのトルク制御システムは構築できたため,まずはこれを歩行ロボットの自由度分の複数個のモータについて拡張する.そこで得られるトルク制御可能な歩行ロボットに対して,当該年度で得られた不整地上の最適歩行軌道生成問題の提案手法に基づく解法を適用することで,提案手法の実機検証を行うことを考えている.
|