移動ロボットの最適化を考える際,ロボット実機を用いた実験結果に基づく最適化法が望まれる.しかし,実験結果には大きなノイズが存在し,1回あたりの観測から得られるデータが少ない一方で,実験に費やす労力の大きさから実験回数は厳しく制約される.そのため,少ない実験回数で最適解が求められる方法が要求されるが,その要求を満たす方法の一つとして応答曲面法が注目されている. 本研究に先立ち,大きなノイズの存在する実験データを基に多目的最適化を行うアルゴリズムを開発したが,実験に失敗する領域を除外するなどの拘束条件などは考慮できていなかった.しかし,ロボットの実機実験を基に最適解の探索を行う際には試行に失敗する可能性があり,失敗試行を導く入力をできる限り避けながら実験を行う必要がある.そこで,本研究では昨年度においてガウス過程分類器を利用して試行が失敗しやすい領域を推定し,その領域を注意深く避けつつ最適解を求める手法を提案した(国内学会誌へ投稿中).しかし,問題設定に不明瞭な部分が存在し,有効性の評価が難しいものであった. 今年度は昨年度の問題点を解決した新たな手法を提案し,適切な評価指標を定めた.その指標に基づき他の複数の手法との比較を行い,有効性を確認した.この結果については現在,国際学会誌への投稿の準備を進めている. 一方,環境変数を含めた応答曲面を作成し,環境変化に対応する点に関しては,従来研究に修正すべき点を発見し,その改善法を考案した.いくつか有効性を示す結果が得られているが,さらなる検証が必要である. 加えて,効率の良い学習をする上でシステムの物理的な理解も重要となる.この観点から,研究主な対象とするヘビ型ロボットを連続曲線で近似し,運動を制御する研究も行った(国際学会誌に掲載).この結果を学習アルゴリズムに反映させる点については今後の課題となる.
|