研究課題/領域番号 |
21K12070
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 東北大学 |
研究代表者 |
山口 明彦 東北大学, 医学系研究科, 非常勤講師 (10625031)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | ロボットラーニング / 強化学習 / ロボットマニピュレーション / 触覚センシング / 触覚マニピュレーション / スキルライブラリ |
研究開始時の研究の概要 |
本研究ではロボットラーニングの立場から「物体操作に関する知識をどのような形で抽象化・構造化して記憶し,物体操作において活用するか?」を追求する.物体操作に関する知識を質の異なる多種のスキルのライブラリを構成することで抽象化し,スキルライブラリに基づき物体操作を実現する制御の計画手法・結果からの学習手法を確立し,ロボットで難易度の高い物体操作,具体的には調理タスクを題材として仮説検証を繰り返す.
|
研究実績の概要 |
本研究では,スキルの組み合わせ探索とパラメータの最適化で構成される「離散連続強化学習」手法の構築と,これにより,ロボットによって調理などの高度な物体操作を自動化することを目標とする.具体的には,次の(A)(B)(C)を研究項目として設定している.(A)スキルライブラリの構築,(B)スキルライブラリを利用したロボット動作の計画・制御・学習手法の開発,(C)シミュレーションやロボットを用いたタスクでの検証.本年度は,各研究項目について,以下の進展があった.(C-1)視触覚センサFingerVisionを搭載した高機能ロボットハンドを開発し,触覚情報処理プログラムや基本制御プログラムを開発した.このハンドを利用し,(A-1)手探り把持スキルを実装した.回日本ロボット学会学術講演会にて(C-1)(A-1)の学会発表を行った.(C-2)注ぐタスクにおいて,漏斗などの道具の使用やマヨネーズの容器のような柔軟な容器をシミュレーション実験で扱えるようにするためのシミュレータを開発した.このシミュレータは,これまでに我々が開発した注ぐタスクの検証シミュレータを改良する形で行われており,これまでと同様に粘性をもった液体などのシミュレーションが実施できることに加えて,(C-2)の改良が導入されている.この成果を回日本ロボット学会学術講演会にて発表した.このシミュレータを利用し,(A-2)注ぐタスクのための新たなスキルとして漏斗を利用するスキル,柔軟な容器を圧縮するスキルを開発した.さらに,(B-1)提案する離散連続強化学習手法で効率的に扱えるようにするダイナミクスモデルの構成方法を開発した.特に,学習したモデルが異なる状況でも共有できる(再利用できる)ような工夫を導入することで,学習効率を向上させることに成功した.一連の成果は国際会議にて発表した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
研究の主軸項目である(A)スキルライブラリの構築,(B)スキルライブラリを利用したロボット動作の計画・制御・学習手法の開発,(C)シミュレーションやロボットを用いたタスクでの検証,のそれぞれについて研究成果があり,理論面と実装・実験面の両方で研究を推進できたと考える.特に,予定していた「注ぐ」スキルのバリエーションを増やすこと,これに伴うシミュレーション環境の開発,ロボットによるモーションの実装,ダイナミクスの学習と推論システムの強化を実施できた.
|
今後の研究の推進方策 |
これまでに開発したスキルセットとロボット動作の計画・制御・学習手法をもとに,より高度・複雑なタスクへの実装を進めるとともに,その過程で明らかになった課題に対する解決策の構築を通じて,ロボット動作の計画・制御・学習手法の改善に取り組む.
|