研究課題
基盤研究(B)
近年、ヒトの教示動作より指令値生成モデルを学習させる模倣学習により、ロボットが高度な環境操作技能を獲得できるようになってきたが、未だに少量のデータから多様な動作を生成できない。そこで、乱数を用いた指令値生成と状態予測により、最適指令値を探索できるサンプルベースモデル予測制御を模倣学習に実装する。2台のロボットを同期させる遠隔操作制御により、ヒトが操作するロボットではロボットへの指令値を、被操作ロボットではロボットと環境の状態データを、それぞれ収集する。このデータから指令値生成モデルと状態予測モデルを作り、サンプルベースモデル予測制御を実現し、新奇動作を生成可能な模倣学習の確立を目指す。