2014 Fiscal Year Annual Research Report
統計的機械学習に基づいた多目的最適化による超冗長ロボットの運動生成
Project/Area Number |
14J02946
|
Research Institution | Kyoto University |
Principal Investigator |
有泉 亮 京都大学, 工学研究科, 特別研究員(DC2)
|
Project Period (FY) |
2014-04-25 – 2016-03-31
|
Keywords | 多目的最適化 / 応答曲面法 / ロボットの運動最適化 |
Outline of Annual Research Achievements |
ロボットの運動パラメータの最適化などを考える場合には,複数の評価指標に対する最適化を考える必要があることが多い.このような場合には一般に解はトレードオフを満たす非劣解の集合として表される.非劣解集合を求める問題を,多目的最適化問題という. この研究ではロボットの多目的最適化法の提案と評価を行う.ロボットの最適化においては,多くの場合評価関数の数学的な表記が得られず,実験で評価関数の値を測定するしかない.このため,ノイズを含んだ少ない観測結果から最適解集合を求めなければならず,効率の良い実験計画が求められる.そこで本研究においては,応答曲面法を利用したロボットの多目的最適化法を提案し,実際のロボットに適用する.提案する最適化法においては,時間・費用を要する実験の回数を抑えながら,解集合の点をできるだけ多く見つけることが目的となる.特に,ロボットの実験においては,ノイズ分散が探索変数によって変化する可能性が高く,このような非等分散ノイズへの対応を行い,その手法の有効性を種々のテスト関数及び実機実験により確認する.一方,応答曲面法では一つの環境における実験から他の環境に関する情報も得ることができる.この情報を利用して,多様な環境に対する最適解を得る新しい最適化法を提案することを目的とする. この研究で提案する多目的最適化法はシステムのモデルを必要としないため,レスキューロボットなど,非常に複雑なシステムに適用できる.特に,環境変数を含んだ最適化が達成されれば,多様な環境に対して適応的に最適な運動を選択しながら活動することが可能となると考えられる.また,本研究では,特に移動ロボットのパラメータに対する多目的最適化を念頭に置いているが,提案する最適化法は非常に一般的な枠組みであり,ロボットに限らず様々な工学的問題に応用できると期待できる.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度は,すでに提案している多目的最適化法の有効性を複数のテスト関数及び実機実験により確認すること,環境変数を導入することにより多様な環境に対して適切な最適解集合の推定を与えるように手法を拡張し,数値例および実機実験により有効性を検証することを予定していた. 一点目の,提案法の有効性検証は順調に行うことができた.特に,従来法との比較において,提案法の方が有効となるような評価関数がどのようなものか判明した.また,今まで最終的な最適化の結果のみから有効性を主張していた近似に対して,より深い検証を行い,用途に対してよく合致した近似であることを確認した.実機実験による検証は,予定していたものは終了したが,より明確な主張ができるよう,追加実験を計画中である. 二点目の環境変数の導入に関しては,当初,単一目的最適化の場合に提案されていたEPSI(Expected Policy Score Improvement)と呼ばれる指標を多目的に拡張することにより達成可能と考えていた.しかし,詳細な検討の結果,EPSIの拡張は困難であることが発覚した.そのため,より簡単な2つの方法を提案し検討・検証を進めている. 一方,当初の計画には組み込まれていなかったが,拘束条件を含む場合の最適化への拡張を行い,検証を進めている.本研究で利用する応答曲面法に基づく最適化においては,単一目的・多目的に関わらず,拘束条件を考慮している研究は非常に少ない.特にロボットの実験による最適化の場合には,拘束条件を満たしているかどうかは判断できても,計測可能な数値を用いて表すことが困難である場合がある.例えば,ロボットが転倒しないという条件は,様々な数値化が試みられているものの,確実な指標は存在しない.本研究ではこのような拘束も含め,従来のものより包括的かつ実用的な最適化法を提示できると考えている.
|
Strategy for Future Research Activity |
まず,数値検証および実機実験に基づき,拘束条件の扱いに関しての検証を進めると同時に,今までに得られた成果をまとめて発表するための準備を行う. また,環境変数を含める場合に関して,検討している2つの方法のうち一方に関しては有効性の検証が残るのみであるので,数値検証及び実機実験により進める.なお,環境変数を含む拡張に関して,実機実験としてはレスキューロボットKOHGA2の使用を予定しているが,システムの老朽化などにより十分な回数の実験が難しい可能性も考えられる.そこで,比較的容易に作成できるヘビ型ロボットを用いた検証についても計画し,実施していく. 環境変数を含む拡張の2つの方法のうちのもう一方に関して,実験計画に用いる指標を得るための計算量が莫大となり,数値例による検証と考察を妨げているという問題がある.計算量の増大は,ガウス過程回帰の結果を用いた評価関数値推定を膨大な点数で行う必要があることによって生じている.ガウス過程回帰の高速化は活発に研究がなされている分野であるが,本研究においては,一般にもっとも計算量の大きい超パラメータの決定ではなく,超パラメータ決定後の推定値算出がより大きな問題となっている点,フィッティングすべきデータ点が非常に限られているという点で,それらの研究で扱われる状況とは異なっている.そこで,本研究の問題に即した解決策を提示する.
|
Research Products
(3 results)