研究課題/領域番号 |
15H01710
|
研究機関 | 早稲田大学 |
研究代表者 |
尾形 哲也 早稲田大学, 理工学術院, 教授 (00318768)
|
研究分担者 |
有江 浩明 早稲田大学, 理工学術院, 助手 (20424814)
|
研究期間 (年度) |
2015-04-01 – 2020-03-31
|
キーワード | 認知ロボティクス / 深層学習 / 予測学習 / End to End学習 / マルチモーダルシステム / 多目的ロボット |
研究実績の概要 |
本研究課題では,人間型ロボットによる複数の卓上タスクを対象として,深層学習による感覚運動の予測学習を用いたロボットの動作生成手法の提案と評価を行なっている. H29年度は,主に(1)動作教示手法の拡張,(2)双腕アームのための神経回路モデル,(3)予測可能性評価に基づく物体操作の自動生成,の3項目にわたる研究を展開した. (1) 動作教示手法の拡張:本課題で提案している深層学習による動作学習は,多様かつ複雑な動作データをいかに効率よく作成するかが重要となる.人間によるデータ作成には通常の制御やモーションキャプチャ,3Dマウスなど様々なデバイスの利用が考えられるが,それぞれに異なる特徴がある.そこで教示者が状況においてデバイスを切り替え,データを生成する手法を開発し料理タスクなどを題材に評価を行なった. (2) 双腕アームのための神経回路モデル:双腕アームによるのスクは,各アームが独立して作業を行う場合と,協調した単一タスクを行う場合がありうる.この異なる特性の作業を同時に学習可能な神経回路モデルについて検討を行なった.具体的には,階層型の神経回路モデルにおいて,複数のモデルを設計し,シミュレーションによりその作業特性を比較した.その結果,部分的な回路共有を持った2つの神経回路モデルの有効性を確認した. (3) 予測可能性評価に基づく物体操作の自動生成:多様性な形状を持つ未学習の物体に対するアプローチは多様にありうる.本研究では「主体は自身の行為結果の予測可能性が最大になる行為を選択する」という仮説のもとに,深層学習を用いた動作生成モデルを構築した.具体的には感覚運動情報の予測値の分散を予測学習するモデルを用い,この分散が最小となる行為を生成するモデルを人間型ロボットのシミュレーションに実装した.多様な位置,方向に配置されたラグビーボールを押すタスクにおいて本手法を評価した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
昨年度までに提案モデルの基礎特性を確認する一連の研究を展開し,国際会議論文として成果発表を行なってきている.また次の応用フェーズにおいて重要となる,多様な作業データ収集という課題に対して,教示手法の検討が行えた.ハンドについては,産業技術総合研究所における機材としての多指ハンド(Allegro Hand)を,臨時に利用可能な目処がついた.本研究の課題とする卓上タスクについての学習と評価を行う準備が整ったと言える.さらに本研究課題の成果について複数の展示会での公開の機会にも恵まれている. 当初の計画に含まれなかった予想外の成果として,本課題における成果論文を複数企業に参照いただき,応用していただけた点である.一つは,汎用型を志向したマルチモーダルAIロボットの開発である.複数企業がそれぞれの汎用技術を持ち寄り,本課題で提案したモデルを再現,同一ハードウェアと同一ソフトウェアで複数作業を行う汎用志向ロボットを3ヶ月という短期間で開発しプレス発表した.本ロボットは複数展示会において展示され注目を浴びた.もう一つは,提案手法の普及,という視点からの開発環境構築である.具体的には他の企業によって本課題の手法を再現可能な深層学習ライブラリとロボットOSのRT-Middlewareの統合環境の構築といった事例に繋がった.このように人間型汎用ロボットのプログラミングコスト削減という,提案手法の大きな狙いが理解され,確実に広まっている.
|
今後の研究の推進方策 |
今後は,教示システムを用いて多様なタスクの実現を目指していく.具体的には,(1)多指ハンドによる物体操作,(2)動作データの収集,(3)エラーリカバリ学習,などが課題となる. (1)多指ハンドによる物体操作:物体の把持に関しては,その汎用性に関して,吸着型とハンド型で議論があるが,タスクを行うことを考えると多指ハンドは有力な候補だと考えられる.今後は教示手法を指の操作に拡張することで,把持だけでなく物体操作の教示と学習を行なっていく.ハンドによる物体操作では画像のオクルージョンの問題が顕在化するため,トルクセンサー,接触センサーが重要となると考えられる. (2)動作データの収集:提案手法は予測学習をベースとしているため,強化学習ほどのデータは必要とはならない.しかし十分に多様な動作へと拡張するためには,多くの動作学習が必須となる.アウトソーシングによるデータ収集,さらにはシミュレーション環境での基礎動作の収集などが課題となると考えられる. (3)エラーリカバリ学習:多様な動作となり,そのシーケンス長が大きくなるにつれて,作業中でのエラーリカバリが重要となってくる.これまでに提案している動作プリミティブの組み合わせ手法にリカバリー動作を加えることで一定の成果が得られると考えられる.理想的には過去に描画モデルとして提案し,成果発表している「誤差逆伝播法を用いた,画像ベースの目標状態への動作プラニングの手法」を援用することを考える.
|