2023 Fiscal Year Annual Research Report
Discrete and Continuous Reinforcement Learning with a Library of Skills and its Application to Robotic Food Manipulation
Project/Area Number |
21K12070
|
Research Institution | Tohoku University |
Principal Investigator |
山口 明彦 東北大学, 医学系研究科, 大学院非常勤講師 (10625031)
|
Project Period (FY) |
2021-04-01 – 2024-03-31
|
Keywords | ロボットラーニング / 強化学習 / ロボットマニピュレーション |
Outline of Annual Research Achievements |
離散的な表現で表されるスキルの組み合わせ,および各スキルの持つ連続的なパラメータを,同時に最適化・学習する問題として「離散連続強化学習」を提案し,この学習を実現する手法の構築を目標とした.この仕組みにより,ロボットによる高度な物体操作を実現する.この学習・推論メカニズムの特性が最も発揮されると考えられるタスクとして,ロボット調理を選択した.このような物体操作では,対象物が食材という柔軟不定形物であり,人間はいとも簡単にこれらの対象物を操作する一方で,ロボットや機械による自動化が難しいタスクとして知られていた.このため,食品産業においても,人手不足に代表される社会課題があるにもかかわらず,自動化が進んでいないプロセスとして残っている.このようなタスクに対するソリューションとして,離散連続強化学習が開発できればインパクトは大きく,社会的意義がある.本研究では,そのための研究項目として,(A)スキルライブラリの構築,(B)スキルライブラリを利用したロボット動作の計画・制御・学習手法の開発,(C)シミュレーションやロボットを用いたタスクでの検証,に取り組んだ.これまでの研究の中で,視触覚センサFingerVisionを搭載した高機能ロボットハンドの開発,触覚情報処理プログラムや基本制御プログラムの開発,手探り把持スキルの実装,漏斗などの道具の使用やマヨネーズの容器のような柔軟な容器をシミュレーション実験で扱えるようにするためのシミュレータの開発,高機能触覚ハンドを利用した柔軟物の把持システム,などを構築した.本年度は,特に柔軟物の把持に力を入れた研究開発を行った.
|