従来の研究において,ロボットの動作計画問題には無数の多様な解が存在しうることが指摘されていたが,それらを一括して導出しモデル化する手法はこれまでなかった。本研究の成果は,無数の多様な軌道を一括して導出・モデル化することを可能にした点で新規性が高い。同様に,多様な挙動を一度に学習することを深層強化学習においても実現した点にも価値がある。本研究で得られた成果は,強化学習等を活用したロボットシステムにおいて環境の変化への適応を劇的に効率化する可能性を秘めており,実社会での適用先を広げると考えられる。また,これらの成果は国際的に認知され,2022年にはロボット学習分野のトップ学会にて招待講演を行った。
|