研究課題/領域番号 |
21K12070
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 東北大学 |
研究代表者 |
山口 明彦 東北大学, 医学系研究科, 大学院非常勤講師 (10625031)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2022年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2021年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | ロボットラーニング / 強化学習 / ロボットマニピュレーション / 触覚センシング / 触覚マニピュレーション / スキルライブラリ |
研究開始時の研究の概要 |
本研究ではロボットラーニングの立場から「物体操作に関する知識をどのような形で抽象化・構造化して記憶し,物体操作において活用するか?」を追求する.物体操作に関する知識を質の異なる多種のスキルのライブラリを構成することで抽象化し,スキルライブラリに基づき物体操作を実現する制御の計画手法・結果からの学習手法を確立し,ロボットで難易度の高い物体操作,具体的には調理タスクを題材として仮説検証を繰り返す.
|
研究成果の概要 |
離散的な表現で表されるスキルの組み合わせ,および各スキルの持つ連続的なパラメータを,同時に最適化・学習する問題として「離散連続強化学習」を提案し,この学習を実現する手法の構築を目標とした.この仕組みにより,ロボットによる高度な物体操作を実現する.この学習・推論メカニズムの特性が最も発揮されると考えられるタスクとして,ロボット調理を選択し,研究開発を行った.
|
研究成果の学術的意義や社会的意義 |
食品を対象とするような物体操作では,対象物が食材という柔軟不定形物であり,人間はいとも簡単にこれらの対象物を操作する一方で,ロボットや機械による自動化が難しいタスクとして知られていた.このため,食品産業においても,人手不足に代表される社会課題があるにもかかわらず,自動化が進んでいないプロセスとして残っている.このようなタスクに対するソリューションとして,離散連続強化学習が開発できればインパクトは大きく,社会的意義がある.
|