2018 年度研究成果報告書

物理接触する人支援ロボットのための支援戦略モデルベース強化学習

研究課題

PDF

研究課題/領域番号	16H05876
研究種目	若手研究(A)
配分区分	補助金
研究分野	知能ロボティクス
研究機関	奈良先端科学技術大学院大学
研究代表者	松原崇充奈良先端科学技術大学院大学, 研究推進機構, 特任准教授 (20508056)
研究期間 (年度)	2016-04-01 – 2019-03-31
キーワード	支援ロボット / 強化学習 / ガウス過程 / ベイズ最適化 / エナジーハーベスター
研究成果の概要	本研究では、物理接触を通じて人を支援するロボットが、被支援者に快適・安全な支援ができるよう、数回程度の実験試行から得られる非常に少ないデータによって、ロボットの制御規則（支援戦略）の自動設計を可能にする技術の確立を目指した。「少量データから実際上の最適戦略の学習」を目指すというパラダイムシフトにより、実用性の高い革新的技術の開発を試みた。その成果として、サンプル効率が高く、物理接触する人支援ロボットの支援戦略学習に適した強化学習アルゴリズムを開発した。さらに、安全性の高い膝動作支援デバイスを開発し、これを用いた支援戦略学習の被験者実験を通じて、提案手法の有効性を確認した。
自由記述の分野	ロボットラーニング
研究成果の学術的意義や社会的意義	本研究では、人支援ロボットの支援戦略学習問題に対して、新しい思想に基づく技術開発を目指した結果、独創性と実用性を兼ね備えた強化学習アルゴリズムの開発に成功した。さらに、評価実験を実施するにあたり開発した膝関節支援デバイス自体も、モータの反トルクによる安全性の高い支援や、CVTの減速比調節によるユーザや状況への適応可能性など、高い学術的価値を持つ。本研究で得られた成果は、様々な人物理支援ロボットの支援戦略を被支援者にテイラーメイドに構築できる可能性を示唆しており、超高齢社会に有益な新しい産業・サービスの創出にも繋がるものと期待される。