研究課題
基盤研究(C)
離散的な表現で表されるスキルの組み合わせ,および各スキルの持つ連続的なパラメータを,同時に最適化・学習する問題として「離散連続強化学習」を提案し,この学習を実現する手法の構築を目標とした.この仕組みにより,ロボットによる高度な物体操作を実現する.この学習・推論メカニズムの特性が最も発揮されると考えられるタスクとして,ロボット調理を選択し,研究開発を行った.
ロボティクス
食品を対象とするような物体操作では,対象物が食材という柔軟不定形物であり,人間はいとも簡単にこれらの対象物を操作する一方で,ロボットや機械による自動化が難しいタスクとして知られていた.このため,食品産業においても,人手不足に代表される社会課題があるにもかかわらず,自動化が進んでいないプロセスとして残っている.このようなタスクに対するソリューションとして,離散連続強化学習が開発できればインパクトは大きく,社会的意義がある.