スキルライブラリに基づく離散連続強化学習と食品マニピュレーション

研究課題

研究課題/領域番号	21K12070
研究種目	基盤研究(C)
配分区分	基金
応募区分	一般
審査区分	小区分61050:知能ロボティクス関連
研究機関	東北大学
研究代表者	山口明彦東北大学, 医学系研究科, 大学院非常勤講師 (10625031)
研究期間 (年度)	2021-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	4,030千円 (直接経費: 3,100千円、間接経費: 930千円) 2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
キーワード	ロボットラーニング / 強化学習 / ロボットマニピュレーション / 触覚センシング / 触覚マニピュレーション / スキルライブラリ
研究開始時の研究の概要	本研究ではロボットラーニングの立場から「物体操作に関する知識をどのような形で抽象化・構造化して記憶し，物体操作において活用するか？」を追求する．物体操作に関する知識を質の異なる多種のスキルのライブラリを構成することで抽象化し，スキルライブラリに基づき物体操作を実現する制御の計画手法・結果からの学習手法を確立し，ロボットで難易度の高い物体操作，具体的には調理タスクを題材として仮説検証を繰り返す．
研究成果の概要	離散的な表現で表されるスキルの組み合わせ，および各スキルの持つ連続的なパラメータを，同時に最適化・学習する問題として「離散連続強化学習」を提案し，この学習を実現する手法の構築を目標とした．この仕組みにより，ロボットによる高度な物体操作を実現する．この学習・推論メカニズムの特性が最も発揮されると考えられるタスクとして，ロボット調理を選択し，研究開発を行った．
研究成果の学術的意義や社会的意義	食品を対象とするような物体操作では，対象物が食材という柔軟不定形物であり，人間はいとも簡単にこれらの対象物を操作する一方で，ロボットや機械による自動化が難しいタスクとして知られていた．このため，食品産業においても，人手不足に代表される社会課題があるにもかかわらず，自動化が進んでいないプロセスとして残っている．このようなタスクに対するソリューションとして，離散連続強化学習が開発できればインパクトは大きく，社会的意義がある．

報告書

(4件)

研究成果
(8件)

すべて 2024 2023 2022 2021

すべて学会発表 (8件) (うち国際学会 3件、招待講演 2件)

[学会発表] Robotic Technologies for Food Factory Automation: Vision, Tactile, and FingerVision2024
- 著者名/発表者名
  Akihiko Yamaguchi
- 学会等名
  ICRA 2024 Workshop on Cooking Robotics: Perception and motion planning
- 関連する報告書
  2023 実績報告書
- 国際学会 / 招待講演
[学会発表] 視覚を利用した触覚センサFingerVision2023
- 著者名/発表者名
  山口明彦
- 学会等名
  画像センシング展特別招待講演
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] Reinforcement Learning with Incremental Skill Models: Extension to Tool Use As Skills2023
- 著者名/発表者名
  Ryota Yashima, Akihiko Yamaguchi, Koichi Hashimoto
- 学会等名
  2013 IEEE/SICE International Symposium on System Integration
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] 液体スキルシミュレータ：道具と柔軟な容器の導入2022
- 著者名/発表者名
  八島諒汰, 山口明彦, 橋本浩一
- 学会等名
  第40回日本ロボット学会学術講演会
- 関連する報告書
  2022 実施状況報告書
[学会発表] 視触覚センサFingerVisionを搭載した高機能ロボットハンド2022
- 著者名/発表者名
  山口明彦
- 学会等名
  第40回日本ロボット学会学術講演会
- 関連する報告書
  2022 実施状況報告書
[学会発表] Sample-Efficient Multimodal Dynamics Modeling for Risk-Sensitive Reinforcement Learning2022
- 著者名/発表者名
  Ryota Yashima, Akihiko Yamaguchi, Koichi Hashimoto
- 学会等名
  8th International Conference on Mechatronics and Robotics Engineering
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] 複雑なダイナミクス構造におけるモデルベース型強化学習のデバッグ手法2021
- 著者名/発表者名
  八島諒汰, 山口明彦, 橋本浩一
- 学会等名
  日本機械学会ロボティクス・メカトロニクス講演会2021
- 関連する報告書
  2021 実施状況報告書
[学会発表] 確率的モデルベース型強化学習における液体マニピュレーションのマルチモーダルダイナミクスの解析2021
- 著者名/発表者名
  八島諒汰, 山口明彦, 橋本浩一
- 学会等名
  第22回計測自動制御学会システムインテグレーション部門講演会
- 関連する報告書
  2021 実施状況報告書

スキルライブラリに基づく離散連続強化学習と食品マニピュレーション

研究代表者

山口 明彦 東北大学, 医学系研究科, 大学院非常勤講師 (10625031)

4,030千円 (直接経費: 3,100千円、間接経費: 930千円)

報告書

研究成果

[学会発表] Robotic Technologies for Food Factory Automation: Vision, Tactile, and FingerVision2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 視覚を利用した触覚センサFingerVision2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Reinforcement Learning with Incremental Skill Models: Extension to Tool Use As Skills2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 液体スキルシミュレータ：道具と柔軟な容器の導入2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 視触覚センサFingerVisionを搭載した高機能ロボットハンド2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Sample-Efficient Multimodal Dynamics Modeling for Risk-Sensitive Reinforcement Learning2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] 複雑なダイナミクス構造におけるモデルベース型強化学習のデバッグ手法2021

著者名/発表者名

学会等名

関連する報告書

[学会発表] 確率的モデルベース型強化学習における液体マニピュレーションのマルチモーダルダイナミクスの解析2021

著者名/発表者名

学会等名

関連する報告書

山口明彦東北大学, 医学系研究科, 大学院非常勤講師 (10625031)