2010 Fiscal Year Annual Research Report
機械学習を用いた環境相互作用の未知な対象物操作の学習制御
Project/Area Number |
22700198
|
Research Institution | Tokyo University of Agriculture and Technology |
Principal Investigator |
小林 祐一 東京農工大学, 大学院・工学研究院, 特任准教授 (60373304)
|
Keywords | ロボット行動学習 / 物体操作 / 接触モードの切り替り / 最適制御・強化学習 / モデル予測制御 / 物体抱え上げ操作 |
Research Abstract |
対象とする対象物がロボットアームのリンク上で接触するような物体抱え上げタスクをモデル化し,Matlab上で運動方程式および接触に関する線形相補性条件を実装し,シミュレーションを構築した.対象とする対象物操作問題としては,対象物とマニピュレータ,対象物と環境の間に滑りや転がりが発生するような操作問題として,物体の抱え上げ動作と回転動作の2種類をモデル化・実装した. 構築された操作問題の制御獲得法として,モデル予測制御にもとづく方法と強化学習にもとづく方法の2種類を開発した.どちらの方法でも,対象物とロボットハンドの接触点での(滑り・転がり・静止など)接触モードの切り替わりを推定するための学習手法として,機械学習の一手法であるサポートベクターマシン(SVM)を適用した.物体操作の動作を試行錯誤しながら,接触モードの切り替わり情報をサンプルとして収集し,どのような制御入力に対して接触モードが変化するかを,サンプルにもとづいて学習したSVMにより推定できることが確認された.この接触モード推定器と最適制御法である強化学習・モデル予測制御とを組み合わせることで,望ましい接触モードを維持した物体操作が可能であることをシミュレーションで確認した.モデル予測制御とSVMの推定結果を組み合わせるために,サンプルデータのクラスタリング方法を考案し,線形不等式の形で表現できる線形SVMでのモード識別法を提案した.これにより,強化学習を用いる場合と比較して,より少ない試行錯誤の量で望ましい軌道に追従する制御の導出が可能であることが確認できた.
|