2016 Fiscal Year Annual Research Report
Self-Organizing Motion Primitives for Robots Utilizing Deep Learning
Project/Area Number |
15H01710
|
Research Institution | Waseda University |
Principal Investigator |
尾形 哲也 早稲田大学, 理工学術院, 教授 (00318768)
|
Co-Investigator(Kenkyū-buntansha) |
有江 浩明 早稲田大学, 次世代ロボット研究機構, その他(招聘研究員) (20424814)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | 深層学習 / End to End学習 / ロボット動作学習 / 動作プリミティブ |
Outline of Annual Research Achievements |
本課題では,人間型ロボットによる多様な卓上タスクを行うことを目的として,ディープラーニングを利用した感覚運動統合を用いたロボットの行動学習手法を提案している. H28年度は,H27年度までに行ったEnd to Endの動作学習法を拡張する形で,複数の動作を深層学習モデルに組み込み,切り替えを実行する手法を開発した.先行研究であるLevineらの手法では,生画像から適切なモータ制御を行う強化学習を提案しているが, 一つのモデルにつの動作しか学習出来ないため, 複数動作の切り替えは困難である.そこで我々はこれまで提案している自己符号化器に再帰型神経回路モデル(RNN)を組み合わせ,RNNの中で複数動作をアトラクタとして表現,状況に応じて遷移させる方法を構築した.従来手法では,動作の移行時に外部から意図的に入力を与えている研究が多く,画像などのセンサ情報からの直接的な切り替えを考慮していない.提案手法では,人間型ロボットNextageを用い,「箱を開ける」,「物を箱に入れる」,「箱を閉じる」の三つのフェーズからなる片付け動作を行わせた.具体的には,自己符号化器により画像を圧縮し, Nextageの両アーム,両グリッパーを合わせたデータをRNNで学習させる.それぞれの動作は個別にアトラクタ軌道として学習する.動作開始時点のRNNの内部状態が近くなるように制限をかける手法を用いた結果,結果,ロボットはタスク動作を一連で学習することなく,オンラインで取り込んだ画像情報から動作の移行が可能となった.さらに,一連の動作を生成中に,人間がステップを戻す,先に進めるなどの介入を行っても,提案手法は問題なく動作順を変更することが可能なこと,さらに類似した未学習物体が扱えること,動作中に未学習位置に物体が移動しても学習領域内であれば把持が可能なこと,などを確認した.
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
H28年度までに完成させた,ROS, RT-Middoleware,Oculus, 3D-マウスによる遠隔操作(動作教示)システムを援用する形で,研究を進めることができている.特に一時的な利用となっていたNextageについて,早稲田大学リーディングプログラムの協力によって,継続利用ができる環境が整ったために,多様な動作についての追加実験を行うことが可能となった. またPR-2で行っていた柔軟物のハンドリングについて,Nextageで完全に再現が可能となり,産業技術総合研究所のプロジェクトでさらに発展をさせる方針が整った点,さらに現時点でジャーナルがアクセプトされるなど,成果は順調に挙げられている. 加えて,本申請課題の大きな目標であった,動作プリミティブの深層学習モデルによる取り扱いについて一定の目処がついた点は大きな収穫である.具体的には,「片付け」という単純タスク,さらに動作プリミティブは事前に与えてはいる基礎実験ではあるものの,手法の提案と構築,評価という点で実機での動作確認ができたこと,さらに神経回路モデルの学習状況を詳細に分析することができた.
|
Strategy for Future Research Activity |
今後は,本申請課題の最終目的である多様なタスクの生成について,検討をしていく.具体的には,(1) エンドエフェクタの再設計,(2) 動作教示手法の拡張,(3) 動作プリミティブの自己組織化,などが課題となってくる. (1) 現在の段階ではグリッパーを利用した動作生成となっているが,本手法は他のエンドエフェクタ,例えば多指ハンドなどにも拡張が可能だと期待される.可能な作業は,ロボットハードウェアの潜在的な作業能力に依存するため,どのようなエンドエフェクタが必要となるか,その設計論を検討する必要がある. (2) 動作教示については,現在のところ3Dマウスによる遠隔操作にとどまっているが,操作自由度が低いため効率的とは言い難い.今後は他のインタフェースなども検討していく必要がある.またロボットが動作中利用な感覚が,画像と関節姿勢情報のみとなっており,これが学習精度に影響している可能性は否定できない.トルクセンサーや触覚センサーなどの導入も検討していく. (3) 本申請課題の最大の目標となる「動作プリミティブ」の扱いであるが,現在のところは人間の設計者が事前に与えている.今後は主にRNNを利用することで,一連の動作から組み合わせ可能なプリミティブを自己組織化する手法についても検討を行っていく.
|
Research Products
(33 results)