• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

深層強化学習における運動シナジー発現のメカニズムの解明

公募研究

研究領域身体-脳の機能不全を克服する潜在的適応力のシステム論的理解
研究課題/領域番号 20H05458
研究種目

新学術領域研究(研究領域提案型)

配分区分補助金
審査区分 複合領域
研究機関東北大学

研究代表者

林部 充宏  東北大学, 工学研究科, 教授 (40338934)

研究期間 (年度) 2020-04-01 – 2022-03-31
研究課題ステータス 完了 (2021年度)
配分額 *注記
5,980千円 (直接経費: 4,600千円、間接経費: 1,380千円)
2021年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
2020年度: 2,990千円 (直接経費: 2,300千円、間接経費: 690千円)
キーワード運動適応 / 運動シナジー / 深層学習 / 超適応の科学 / 強化学習 / 運動学習
研究開始時の研究の概要

運動シナジーが人間の運動制御で用いられていることは既知であるが、計算論的に中枢神経がどのような法則に基づいて、どのようなメカニズムでそれが生成されているかは計算論的数理モデル構築には至っていない。計算論的神経科学では、何らかの評価関数を最小にする(最適化)するような計算方法が提案されている。最適化計算には環境と身体の数学的モデルが事前に必要となってしまう。これまではどのような計算指針でシナジーが生成できるのかのメカニズムを扱うものはほとんどなかった。その数理メカニズムの非線形ダイナミクスシステムとしての理解を深め、深層学習と統合し多様な機械力学的運動へ適応した際の拡張性、有効性を検証する。

研究実績の概要

冗長性を克服して、人間の運動の神経制御を再現する制御戦略を解明することは、人間の運動制御分野において中心的な課題である。これまで数理最適化に基づくアプローチが用いられてきた。しかし数学的最適化は、マニピュレータと環境の事前情報が与えられている場合のみ最適解を提供できる。
物理的に複雑で高次元の問題を扱うため、強化学習に深層学習技術を適用する深層強化学習(DRL)は、モデルフリーなアプローチとして有望である。しかし、現在のアルゴリズムは運動協調的な動作を考慮していないため、不自然でぎこちない制御結果になりがちである。
本研究ではリーチング運動追従タスクにおいて2種類のDRL制御を検証した。腕のモデルにDRLを適用した場合、行動コマンドはエージェントに与えるべき開ループ入力として学習される。これはDRLのフレームワークの標準的な手法である。さらに、フィードバック制御ループを持ちながらDRLを適用する、PD制御とDRL制御を組み合わせたものを「PDRL」と名付けた。
DRLとPDRLの両方で、単位エネルギーあたりの誤差指数の性能が最適化されていることを確認した。PDRLの指数はどのケースでもDRLのみの指数より概ね大きくなることが分かった。フィードバック信号により学習速度も3割向上するという結果が得られた。報酬関数に関節間のシナジーを明示的に記述しなかったが、学習過程でシナジー現象が自然に出現することを確認した。この結果は、シナジーの背後に誤差エネルギー最適化の問題が存在することを示唆している。さらに提案したフィードバック増幅型DRL制御の結果は,シナジーの発達と誤差エネルギー指数の点でDRLよりも優れた能力を示している。フィードバック制御が不必要なランダム探索を回避することでフィードフォワード項の発展を支援し、探索効率の向上につながることを示唆している。

現在までの達成度 (段落)

令和3年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和3年度が最終年度であるため、記入しない。

報告書

(2件)
  • 2021 実績報告書
  • 2020 実績報告書
  • 研究成果

    (18件)

すべて 2021 2020 その他

すべて 雑誌論文 (6件) (うち査読あり 6件、 オープンアクセス 4件) 学会発表 (10件) (うち国際学会 5件、 招待講演 1件) 備考 (2件)

  • [雑誌論文] Individual deformability compensation of soft hydraulic actuators through iterative learning-based neural network2021

    • 著者名/発表者名
      Sugiyama Taku、Kutsuzawa Kyo、Owaki Dai、Hayashibe Mitsuhiro
    • 雑誌名

      Bioinspiration & Biomimetics

      巻: 16 号: 5 ページ: 056016-056016

    • DOI

      10.1088/1748-3190/ac1b6f

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Spiking Neural Network Discovers Energy-Efficient Hexapod Motion in Deep Reinforcement Learning2021

    • 著者名/発表者名
      Naya Katsumi、Kutsuzawa Kyo、Owaki Dai、Hayashibe Mitsuhiro
    • 雑誌名

      IEEE Access

      巻: 9 ページ: 150345-150354

    • DOI

      10.1109/access.2021.3126311

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Synergy Emergence in Deep Reinforcement Learning for Full-Dimensional Arm Manipulation2021

    • 著者名/発表者名
      Han Jihui、Chai Jiazheng、Hayashibe Mitsuhiro
    • 雑誌名

      IEEE Transactions on Medical Robotics and Bionics

      巻: 3 号: 2 ページ: 498-509

    • DOI

      10.1109/tmrb.2021.3056924

    • 関連する報告書
      2021 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Motor Synergy Development in High-Performing Deep Reinforcement Learning Algorithms2020

    • 著者名/発表者名
      Chai Jiazheng、Hayashibe Mitsuhiro
    • 雑誌名

      IEEE Robotics and Automation Letters

      巻: 5 号: 2 ページ: 1271-1278

    • DOI

      10.1109/lra.2020.2968067

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [雑誌論文] Decoding Hand Motor Imagery Tasks Within the Same Limb From EEG Signals Using Deep Learning2020

    • 著者名/発表者名
      Achanccaray David、Hayashibe Mitsuhiro
    • 雑誌名

      IEEE Transactions on Medical Robotics and Bionics

      巻: 2 号: 4 ページ: 692-699

    • DOI

      10.1109/tmrb.2020.3025364

    • 関連する報告書
      2020 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Discovering Interpretable Dynamics by Sparsity Promotion on Energy and the Lagrangian2020

    • 著者名/発表者名
      Chu Hoang K.、Hayashibe Mitsuhiro
    • 雑誌名

      IEEE Robotics and Automation Letters

      巻: 5 号: 2 ページ: 2154-2160

    • DOI

      10.1109/lra.2020.2970626

    • 関連する報告書
      2020 実績報告書
    • 査読あり
  • [学会発表] Quantification of Joint Redundancy considering Dynamic Feasibility using Deep Reinforcement Learning2021

    • 著者名/発表者名
      J. Chai, M. Hayashibe
    • 学会等名
      IEEE Int. Conf. on Robotics and Automation (ICRA2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Deep Reinforcement Learning Framework for Underwater Locomotion of Soft Robot2021

    • 著者名/発表者名
      L. Guanda, J. Shintake, M. Hayashibe
    • 学会等名
      IEEE Int. Conf. on Robotics and Automation (ICRA2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Deep Reinforcement Learning with Gait Mode Specification for Quadrupedal Trot-Gallop Energetic Analysis2021

    • 著者名/発表者名
      J. Chai, D. Owaki, M. Hayashibe
    • 学会等名
      43rd Annual International Conferences of the IEEE Engineering in Medicine and Biology Society (EMBC2021)
    • 関連する報告書
      2021 実績報告書
    • 国際学会
  • [学会発表] Motor Synergy Emergence in Redundancy through Deep Reinforcement Learning2021

    • 著者名/発表者名
      M. Hayashibe
    • 学会等名
      32nd 2021 International Symposium on Micro-NanoMechatronics and Human Science
    • 関連する報告書
      2021 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] モデルベース強化学習により獲得される歩行運動に内在する脚協調構造2021

    • 著者名/発表者名
      吉田高志,Jiazheng Chai,沓澤京,大脇大,林部充宏
    • 学会等名
      ロボティクス・メカトロニクス講演会(ROBOMECH2021)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] 筋骨格モデルを用いた運動学習におけるモジュラリティの役割検証2021

    • 著者名/発表者名
      福西彬仁,沓澤 京、大脇 大,林部 充宏
    • 学会等名
      ロボティクス・メカトロニクス講演会(ROBOMECH2021)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] モデルベース強化学習を用いたヘビ型ロボットの実験的検証2021

    • 著者名/発表者名
      平井虎太朗,沓澤 京、大脇 大,林部 充宏
    • 学会等名
      ロボティクス・メカトロニクス講演会(ROBOMECH2021)
    • 関連する報告書
      2021 実績報告書
  • [学会発表] サイクリング運動の速度・負荷変化に対する筋シナジー適応解析2020

    • 著者名/発表者名
      猪股 映史,Felipe M. Ramos,沓澤 京、大脇 大,林部 充宏
    • 学会等名
      第38回日本ロボット学会学術講演会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] 深層強化学習を用いたばね付き準受動歩行モデルにおける歩容生成2020

    • 著者名/発表者名
      清水寛子,沓澤 京、大脇 大,林部 充宏
    • 学会等名
      第21回計測自動制御学会SI部門講演会
    • 関連する報告書
      2020 実績報告書
  • [学会発表] Emergence of Motor Synergy in Multi-directional Reaching with Deep Reinforcement Learning2020

    • 著者名/発表者名
      J. Han, J. Chai, M. Hayashibe
    • 学会等名
      IEEE/SICE International Symposium on System Integration
    • 関連する報告書
      2020 実績報告書
    • 国際学会
  • [備考] Neuro-Robotics Lab

    • URL

      http://neuro.mech.tohoku.ac.jp/

    • 関連する報告書
      2021 実績報告書
  • [備考] Neuro-Robotics Lab, Tohoku University

    • URL

      http://neuro.mech.tohoku.ac.jp/

    • 関連する報告書
      2020 実績報告書

URL: 

公開日: 2020-04-28   更新日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi