本研究では、ロボットによる器用な物体操作課題を可能にする高データ効率でかつ精密なマルチモーダル深層模倣学習の機構を探求した。従来のロボットによる物体操作は、専門家によるルールベースの設計が必要で、バナナの皮むきなど、そのルールがはっきりとわからないタスクでは適用できなかった。しかし、本研究で提案されたアプローチにより、より少数のデータから人間の物体操作スキルの獲得ができ、人間の専門家からの事前知識を要しない器用な物体操作スキルの獲得ができた。
模倣学習において、ロボットの軌跡の器用さと安定性はトレードオフ関係にある性質である。なぜなら、器用な物体操作方策は、蓄積誤差に脆弱であり、結果として軌跡の安定性を損なうからである。本研究では、器用さと安定性の両方を達成するために、global action(物体をつかむために手を動かすなどの全域領域での行動)と、local action(手が物体を操作する局所的な行動)を、それぞれ軌跡全体を一度に予測して実行するフィードフォワード制御と、反応的なフィードバック制御で割り当てた。これにより、ロボットは物体周辺の局所領域でのみ反応的な行動を取り、蓄積誤差の影響を最小化した。
さらに、力覚フィードバックを必要とするタスクのための深層模倣学習機構を調査し、複雑な制御システムや高価なバイラテラル(bilateral)システムを必要とせず、ロボットなしでマスターコントローラーだけを用いる教示方法を提案した。提案方法では、人間の視線情報を使用し、視線周辺の局所領域のビジョン情報のみを使用することにより、マスターコントローラ側とロボット側の違いを最小限に抑える学習方法を考案し、栓抜きという力を必要とするタスクを模倣学習で学習することに成功した。
|