2016 Fiscal Year Annual Research Report
自己と他者の動作データからの内部モデルの構築と行動則の獲得
Project Area | Correspondence and Fusion of Artificial Intelligence and Brain Science |
Project/Area Number |
16H06565
|
Research Institution | Advanced Telecommunications Research Institute International |
Principal Investigator |
森本 淳 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究室長 (10505986)
|
Project Period (FY) |
2016-06-30 – 2021-03-31
|
Keywords | ロボティクス / 機械学習 |
Outline of Annual Research Achievements |
自己と他者の動作データからの内部モデルの構築と行動則の獲得に向けて、ヒューマノイドロボットの動力学的特性の理論的解析を通じた階層構造の導出を行った。また、その階層性とモデルベースの強化学習手法を組み合わせることにより、効率的な行動則の獲得が可能であることを、シミュレータを用いた検証を通じて確認した。具体的には、多自由度のヒューマノイドモデルにおいて、歩行、走行などの周期運動に加えて、座る、立つ、ジャンプなどの離散運動を実時間で生成可能であることを、シミュレーション実験を通じて示した。モデルベース強化学習の考えを基礎としたオンラインの方策導出のアプローチは、多自由度のロボットの制御に有用であると考えられてきた一方で、計算量の問題で実時間制御は困難であると考えられてきた。そこで、本研究ではヒューマノイドロボットモデルの動力学的階層構造を導出し、階層ごとに異なるモデル予測の時間的な長さおよび、異なる制御周期を導入することにより、多自由度のヒューマノイドモデルにおいても実時間での運動制御出力の導出が可能となった。さらに、動作の動的表現を用いたヒューマノイドロボットの自己動作の生成手法についても研究が進捗した。 一方で、他者動作データの利用については、逆強化学習の枠組みを用いたヒト動作データからの動作目的関数の推定とそれを用いたヒューマノイドロボットモデルの動作生成を行った。具体的には、歩行動作とジャンプ動作についてヒトの動作データをモーションキャプチャーシステムにより取得し、そのデータに基づいて動作目的関数を導出した。ここで、あらたに上述のヒューマノイドロボットモデルの階層構造に対応した逆強化学習手法を提案し、シームレスに推定した動作目的関数をヒューマノイドロボットモデルのオンライン動作生成に応用可能とした。 加えて、ヒューマノイドロボットの実験プラットフォームの整備を進めた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
ヒューマノイドロボットの動力学的特性の理論的解析を通じた階層構造の導出を行った。また、その階層性とモデルベースの強化学習手法を組み合わせることにより、効率的な行動則の獲得が可能であることを、シミュレータを用いた検証を通じて確認した。これらの成果について国際会議において発表を行った。さらに、動作の動的表現を用いたヒューマノイドロボットの自己動作の生成手法について国際共同研究により進捗し、国際会議において成果発表を行った。一方で、他者動作データの利用については、逆強化学習の枠組みを用いたヒト動作データからの動作目的関数の推定とそれを用いたヒューマノイドロボットモデルの動作生成に成功した。加えて、ヒューマノイドロボットの実験プラットフォームの整備も順調に進めることができた。
|
Strategy for Future Research Activity |
ヒトの身体やヒューマノイドロボットのような高次元・多自由度の系に対して行動則を導出するには、身体モデルを用いた運動学習のアプローチを用いることが有望であると考えられる。そこで、現在までは、身体モデルに対して力学的な階層表現を導出し、その階層性を用いた効率的な行動則の計算手法を提案した。今後はさらに、提案手法の実ロボットを用いた検証を進める。まずは、比較的構造のシンプルな実アクチュエータシステムに対して実時間制御が可能であるかを確認するための実装を進める。 加えて、深層学習モデルと動的な方策表現を結合することにより、画像入力から動作生成を可能とするEnd-to-endの方策学習モデルの提案を行い、初期的な自己動作モデルの検証のための実ロボットにおける提案手法の実装を進める。
|
Research Products
(5 results)