2021 年度実績報告書

深層強化学習における運動シナジー発現のメカニズムの解明

公募研究

研究領域	身体－脳の機能不全を克服する潜在的適応力のシステム論的理解
研究課題/領域番号	20H05458
研究機関	東北大学
研究代表者	林部充宏東北大学, 工学研究科, 教授 (40338934)
研究期間 (年度)	2020-04-01 – 2022-03-31
キーワード	運動適応 / 運動シナジー / 深層学習 / 超適応の科学 / 強化学習
研究実績の概要	冗長性を克服して、人間の運動の神経制御を再現する制御戦略を解明することは、人間の運動制御分野において中心的な課題である。これまで数理最適化に基づくアプローチが用いられてきた。しかし数学的最適化は、マニピュレータと環境の事前情報が与えられている場合のみ最適解を提供できる。物理的に複雑で高次元の問題を扱うため、強化学習に深層学習技術を適用する深層強化学習(DRL)は、モデルフリーなアプローチとして有望である。しかし、現在のアルゴリズムは運動協調的な動作を考慮していないため、不自然でぎこちない制御結果になりがちである。本研究ではリーチング運動追従タスクにおいて2種類のDRL制御を検証した。腕のモデルにDRLを適用した場合、行動コマンドはエージェントに与えるべき開ループ入力として学習される。これはDRLのフレームワークの標準的な手法である。さらに、フィードバック制御ループを持ちながらDRLを適用する、PD制御とDRL制御を組み合わせたものを「PDRL」と名付けた。 DRLとPDRLの両方で、単位エネルギーあたりの誤差指数の性能が最適化されていることを確認した。PDRLの指数はどのケースでもDRLのみの指数より概ね大きくなることが分かった。フィードバック信号により学習速度も3割向上するという結果が得られた。報酬関数に関節間のシナジーを明示的に記述しなかったが、学習過程でシナジー現象が自然に出現することを確認した。この結果は、シナジーの背後に誤差エネルギー最適化の問題が存在することを示唆している。さらに提案したフィードバック増幅型DRL制御の結果は，シナジーの発達と誤差エネルギー指数の点でDRLよりも優れた能力を示している。フィードバック制御が不必要なランダム探索を回避することでフィードフォワード項の発展を支援し、探索効率の向上につながることを示唆している。
現在までの達成度 (段落)	令和3年度が最終年度であるため、記入しない。
今後の研究の推進方策	令和3年度が最終年度であるため、記入しない。

研究成果
(11件)

すべて 2021 その他

すべて雑誌論文 (3件) (うち査読あり 3件、オープンアクセス 3件) 学会発表 (7件) (うち国際学会 4件、招待講演 1件) 備考 (1件)

[雑誌論文] Individual deformability compensation of soft hydraulic actuators through iterative learning-based neural network2021
- 著者名/発表者名
  Sugiyama Taku、Kutsuzawa Kyo、Owaki Dai、Hayashibe Mitsuhiro
- 雑誌名
  
  Bioinspiration & Biomimetics
  
  巻: 16 ページ: 056016～056016
- DOI
  10.1088/1748-3190/ac1b6f
- 査読あり / オープンアクセス
[雑誌論文] Spiking Neural Network Discovers Energy-Efficient Hexapod Motion in Deep Reinforcement Learning2021
- 著者名/発表者名
  Naya Katsumi、Kutsuzawa Kyo、Owaki Dai、Hayashibe Mitsuhiro
- 雑誌名
  
  IEEE Access
  
  巻: 9 ページ: 150345～150354
- DOI
  10.1109/ACCESS.2021.3126311
- 査読あり / オープンアクセス
[雑誌論文] Synergy Emergence in Deep Reinforcement Learning for Full-Dimensional Arm Manipulation2021
- 著者名/発表者名
  Han Jihui、Chai Jiazheng、Hayashibe Mitsuhiro
- 雑誌名
  
  IEEE Transactions on Medical Robotics and Bionics
  
  巻: 3 ページ: 498～509
- DOI
  10.1109/TMRB.2021.3056924
- 査読あり / オープンアクセス
[学会発表] Quantification of Joint Redundancy considering Dynamic Feasibility using Deep Reinforcement Learning2021
- 著者名/発表者名
  J. Chai, M. Hayashibe
- 学会等名
  IEEE Int. Conf. on Robotics and Automation (ICRA2021)
- 国際学会
[学会発表] Deep Reinforcement Learning Framework for Underwater Locomotion of Soft Robot2021
- 著者名/発表者名
  L. Guanda, J. Shintake, M. Hayashibe
- 学会等名
  IEEE Int. Conf. on Robotics and Automation (ICRA2021)
- 国際学会
[学会発表] Deep Reinforcement Learning with Gait Mode Specification for Quadrupedal Trot-Gallop Energetic Analysis2021
- 著者名/発表者名
  J. Chai, D. Owaki, M. Hayashibe
- 学会等名
  43rd Annual International Conferences of the IEEE Engineering in Medicine and Biology Society (EMBC2021)
- 国際学会
[学会発表] Motor Synergy Emergence in Redundancy through Deep Reinforcement Learning2021
- 著者名/発表者名
  M. Hayashibe
- 学会等名
  32nd 2021 International Symposium on Micro-NanoMechatronics and Human Science
- 国際学会 / 招待講演
[学会発表] モデルベース強化学習により獲得される歩行運動に内在する脚協調構造2021
- 著者名/発表者名
  吉田高志，Jiazheng Chai，沓澤京，大脇大，林部充宏
- 学会等名
  ロボティクス・メカトロニクス講演会(ROBOMECH2021)
[学会発表] 筋骨格モデルを用いた運動学習におけるモジュラリティの役割検証2021
- 著者名/発表者名
  福西彬仁，沓澤京、大脇大，林部充宏
- 学会等名
  ロボティクス・メカトロニクス講演会(ROBOMECH2021)
[学会発表] モデルベース強化学習を用いたヘビ型ロボットの実験的検証2021
- 著者名/発表者名
  平井虎太朗，沓澤京、大脇大，林部充宏
- 学会等名
  ロボティクス・メカトロニクス講演会(ROBOMECH2021)
[備考] Neuro-Robotics Lab
- URL
  http://neuro.mech.tohoku.ac.jp/

2021 年度 実績報告書

深層強化学習における運動シナジー発現のメカニズムの解明

研究代表者

林部 充宏 東北大学, 工学研究科, 教授 (40338934)

研究成果

[雑誌論文] Individual deformability compensation of soft hydraulic actuators through iterative learning-based neural network2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Spiking Neural Network Discovers Energy-Efficient Hexapod Motion in Deep Reinforcement Learning2021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Synergy Emergence in Deep Reinforcement Learning for Full-Dimensional Arm Manipulation2021

著者名/発表者名

雑誌名

DOI

[学会発表] Quantification of Joint Redundancy considering Dynamic Feasibility using Deep Reinforcement Learning2021

著者名/発表者名

学会等名

[学会発表] Deep Reinforcement Learning Framework for Underwater Locomotion of Soft Robot2021

著者名/発表者名

学会等名

[学会発表] Deep Reinforcement Learning with Gait Mode Specification for Quadrupedal Trot-Gallop Energetic Analysis2021

著者名/発表者名

学会等名

[学会発表] Motor Synergy Emergence in Redundancy through Deep Reinforcement Learning2021

著者名/発表者名

学会等名

[学会発表] モデルベース強化学習により獲得される歩行運動に内在する脚協調構造2021

著者名/発表者名

学会等名

[学会発表] 筋骨格モデルを用いた運動学習におけるモジュラリティの役割検証2021

著者名/発表者名

学会等名

[学会発表] モデルベース強化学習を用いたヘビ型ロボットの実験的検証2021

著者名/発表者名

学会等名

[備考] Neuro-Robotics Lab

URL

2021 年度実績報告書

林部充宏東北大学, 工学研究科, 教授 (40338934)