2012 Fiscal Year Research-status Report
確率解析と統計力学に基づく非線形確率最適制御の新しい解法と学習への応用
Project/Area Number |
24760338
|
Research Category |
Grant-in-Aid for Young Scientists (B)
|
Research Institution | Hiroshima University |
Principal Investigator |
佐藤 訓志 広島大学, 工学(系)研究科(研究院), 助教 (60533643)
|
Project Period (FY) |
2012-04-01 – 2015-03-31
|
Keywords | 非線形制御 / 確率制御 / 最適制御 |
Research Abstract |
当該年度に実施した研究の成果として,確率解析と統計力学に基づく非線形確率システムの最適フィードバック補償器の生成法を構築した.確率最適制御の最適フィードバック補償器を得るには,非線形2階偏微分方程式である確率ハミルトン・ヤコビ(以降SHJと表記する)方程式を解く必要があるが,一般的に非常に難しい.そこで本研究では,H.J. Kappenにより提案された経路積分確率最適制御法に注目した.この方法は二つの特徴をもつ.まず特別な指数変換を導入することで,SHJ方程式を線形2階偏微分方程式へと帰着させる.つぎに確率解析の手法を利用することで,この方程式の解を陽に与え,統計力学の手法に基づく解の計算方法を与えている.この様な利点をもつ一方で,この手法は,制御対象にある特別な仮定が必要であり,これがこの手法の適用範囲を大きく制限していた. 当該年度に構築した手法は,上記の従来法が持つ仮定を排除することができ,これにより広いクラスの制御対象に適用できるようになった.提案法では特別な反復規則を考案し,従来法の仮定を用いる代わりに,反復法によりSHJ方程式の逐次近似解を与えることができる.さらに,上記の仮定が成立する場合は,提案法は従来法と一致するため反復計算は必要ない.つまり,提案手法は従来法の仮定を必要とせず,さらに従来法を特別な場合として含む一般化となっている.当該年度では,まず提案手法の核である反復規則を提案し,この反復解法が収束する場合,その収束解がSHJ方程式の解を与えることを示した.さらに,提案法が収束するための条件を導出した.これにより,広いクラスの非線形確率システムに対し,最適フィードバック補償器を設計することが可能となる.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当該年度の目標であった,従来法がもつ特別な仮定を排除した反復解法に基づく非線形確率最適制御法を構築することができ,さらに提案法が収束するための条件も導出できたため.
|
Strategy for Future Research Activity |
今後は残りの研究目標である「提案手法のモデルフリー学習制御への拡張」と「提案手法の実機検証.特に歩行ロボットを用いた最適歩行軌道生成問題への適用」の達成を目指す. 当該年度において提案手法の収束性や,得られた解が,対象とする非線形確率最適制御問題の解と一致することなどを理論的に明らかにすることができた.一方で,実用上の問題として必要な計算量が多くなってしまうという課題が残っている.これは提案手法が統計力学を利用しており,多くのサンプルの生成,個々のサンプルにおける動力学計算を要するためである.そこで,平成25年度ではまずこの問題を検証し,解決することから始める.具体的には,数値計算法の改良,並列計算可能な枠組みへの拡張などを計画している.その後,この手法をモデルを用いない学習的解法へと拡張する.具体的な方策として,研究代表者のこれまでの結果も利用することを考えている.まず制御対象を確率ハミルトン系に限定する.すると申請者のこれまでの確率ハミルトン系に関する研究結果より,モデル情報を用いずにノイズ下における評価関数の期待値の勾配が計算できるため,これを提案法と組み合わせることを考えている. もう一つの目標に対しては,研究代表者はZMP社製12自由度の歩行ロボットe-nuvoを保有するため,これを用いて構築した手法の実機検証を行うことを考えている.ただし,このロボットは目標軌道に対する位置制御を想定しており,そのままでは上記の手法で必要なトルク制御が実現できない.このロボットのモータは双葉電子工業製RS601CRを基にしており,このモータの制御ボードを改良することでトルク制御を実現することを考えている.そこで,まずはRS601CR単体を購入し,この基板の開発実験を行った後e-nuvoにも実装し実験を行い,最終的に三つ目の研究目標の達成を目指す.
|
Expenditure Plans for the Next FY Research Funding |
前述した次年度の課題の一つである,提案手法の計算量の削減を達成するために研究費を使用することを考えている.具体的には,マルチコアCPUまたはGPGPUを有する計算機と並列計算用ソフトウェアの購入を予定している.また,二つ目の研究目標である実機試験の準備として,トルク制御用のモータ駆動ボードの開発を行うため,マイコンやICを含む電子部品を購入する.この他に,非線形制御理論,ロボティクスに関する最新の動向などの情報収集のための旅費の使用を計画している.
|
Research Products
(12 results)