2016 年度実績報告書

自己と他者の動作データからの内部モデルの構築と行動則の獲得

計画研究

研究領域	人工知能と脳科学の対照と融合
研究課題/領域番号	16H06565
研究機関	株式会社国際電気通信基礎技術研究所
研究代表者	森本淳株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究室長 (10505986)
研究期間 (年度)	2016-06-30 – 2021-03-31
キーワード	ロボティクス / 機械学習
研究実績の概要	自己と他者の動作データからの内部モデルの構築と行動則の獲得に向けて、ヒューマノイドロボットの動力学的特性の理論的解析を通じた階層構造の導出を行った。また、その階層性とモデルベースの強化学習手法を組み合わせることにより、効率的な行動則の獲得が可能であることを、シミュレータを用いた検証を通じて確認した。具体的には、多自由度のヒューマノイドモデルにおいて、歩行、走行などの周期運動に加えて、座る、立つ、ジャンプなどの離散運動を実時間で生成可能であることを、シミュレーション実験を通じて示した。モデルベース強化学習の考えを基礎としたオンラインの方策導出のアプローチは、多自由度のロボットの制御に有用であると考えられてきた一方で、計算量の問題で実時間制御は困難であると考えられてきた。そこで、本研究ではヒューマノイドロボットモデルの動力学的階層構造を導出し、階層ごとに異なるモデル予測の時間的な長さおよび、異なる制御周期を導入することにより、多自由度のヒューマノイドモデルにおいても実時間での運動制御出力の導出が可能となった。さらに、動作の動的表現を用いたヒューマノイドロボットの自己動作の生成手法についても研究が進捗した。一方で、他者動作データの利用については、逆強化学習の枠組みを用いたヒト動作データからの動作目的関数の推定とそれを用いたヒューマノイドロボットモデルの動作生成を行った。具体的には、歩行動作とジャンプ動作についてヒトの動作データをモーションキャプチャーシステムにより取得し、そのデータに基づいて動作目的関数を導出した。ここで、あらたに上述のヒューマノイドロボットモデルの階層構造に対応した逆強化学習手法を提案し、シームレスに推定した動作目的関数をヒューマノイドロボットモデルのオンライン動作生成に応用可能とした。加えて、ヒューマノイドロボットの実験プラットフォームの整備を進めた。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由ヒューマノイドロボットの動力学的特性の理論的解析を通じた階層構造の導出を行った。また、その階層性とモデルベースの強化学習手法を組み合わせることにより、効率的な行動則の獲得が可能であることを、シミュレータを用いた検証を通じて確認した。これらの成果について国際会議において発表を行った。さらに、動作の動的表現を用いたヒューマノイドロボットの自己動作の生成手法について国際共同研究により進捗し、国際会議において成果発表を行った。一方で、他者動作データの利用については、逆強化学習の枠組みを用いたヒト動作データからの動作目的関数の推定とそれを用いたヒューマノイドロボットモデルの動作生成に成功した。加えて、ヒューマノイドロボットの実験プラットフォームの整備も順調に進めることができた。
今後の研究の推進方策	ヒトの身体やヒューマノイドロボットのような高次元・多自由度の系に対して行動則を導出するには、身体モデルを用いた運動学習のアプローチを用いることが有望であると考えられる。そこで、現在までは、身体モデルに対して力学的な階層表現を導出し、その階層性を用いた効率的な行動則の計算手法を提案した。今後はさらに、提案手法の実ロボットを用いた検証を進める。まずは、比較的構造のシンプルな実アクチュエータシステムに対して実時間制御が可能であるかを確認するための実装を進める。加えて、深層学習モデルと動的な方策表現を結合することにより、画像入力から動作生成を可能とするEnd-to-endの方策学習モデルの提案を行い、初期的な自己動作モデルの検証のための実ロボットにおける提案手法の実装を進める。

研究成果
(5件)

すべて 2016 その他

すべて国際共同研究 (1件) 学会発表 (3件) (うち国際学会 2件、招待講演 1件) 図書 (1件)

[国際共同研究] Jozef Stefan Institute(スロベニア)
- 国名
  スロベニア
- 外国機関名
  Jozef Stefan Institute
[学会発表] Trajectory representation by nonlinear scaling of dynamic movement primitives2016
- 著者名/発表者名
  A.Ude, R.Vuga, B.Nemec, J.Morimoto
- 学会等名
  IEEE/RSJ International Conference on Intelligent Robots and Systems(IROS2016)
- 国際学会
[学会発表] ヒューマノイドロボットの運動学習2016
- 著者名/発表者名
  森本淳
- 学会等名
  第16回Kフォーラムざっくばらんフォーラム「情報学からの価値創造」
- 招待講演
[学会発表] A hierarchical model predictive control approach to generate biped robot movements in real-time2016
- 著者名/発表者名
  K.Ishihara, J.Morimoto
- 学会等名
  IEEE International Conference on Simulation, Modeling, and Programming for Autonomous Robots(SIMPAR2016) Workshop
- 国際学会
[図書] これからの強化学習「高次元・実環境における強化学習」2016
- 著者名/発表者名
  森本淳、杉本徳和
- 総ページ数
  9
- 出版者
  森北出版
- ISBN
  4627880316

2016 年度 実績報告書

自己と他者の動作データからの内部モデルの構築と行動則の獲得

研究代表者

森本 淳 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究室長 (10505986)

現在までの達成度 (区分)

理由

研究成果

[国際共同研究] Jozef Stefan Institute(スロベニア)

国名

外国機関名

[学会発表] Trajectory representation by nonlinear scaling of dynamic movement primitives2016

著者名/発表者名

学会等名

[学会発表] ヒューマノイドロボットの運動学習2016

著者名/発表者名

学会等名

[学会発表] A hierarchical model predictive control approach to generate biped robot movements in real-time2016

著者名/発表者名

学会等名

[図書] これからの強化学習 「高次元・実環境における強化学習」2016

著者名/発表者名

総ページ数

出版者

ISBN

2016 年度実績報告書

森本淳株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 研究室長 (10505986)

[図書] これからの強化学習「高次元・実環境における強化学習」2016