• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 実績報告書

統計的機械学習の手法を用いたデータ駆動型非線形準最適制御

研究課題

研究課題/領域番号 19K20375
研究機関名古屋大学

研究代表者

有泉 亮  名古屋大学, 工学研究科, 助教 (30775143)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード強化学習 / ロボット / 制御工学
研究実績の概要

生物模倣ロボットなどの多自由度ロボットへの適用を想定し,データ効率の高い強化学習の提案を行った.研究計画の時点では応答曲面法と呼ばれる手法に着目していたが,この方針では十分な効率化は達成困難であると判断された.そこで,本研究ではPI2と呼ばれる強化学習手法に着目した.この方法は比較的高次元のシステムでも効率よく学習できることが知られている.しかし,これにはいくつか使用者が設定するパラメータがあり,そのパラメータの設定によりデータ効率が大きく左右されるという問題があった.本研究ではこれらのパラメータに対し自動調整のための手法を提案した.これにより,例えば従来法では達成困難であった多脚ロボットの起き上がり動作を比較的少ない実験回数で獲得することに成功している.これらの結果の一部についてはIEEEの論文誌にて発表済みであり,また,残りの部分についてもIEEEの論文誌での発表を目指し,査読への対応を行っているところである.
上記の方法はデータの使い方に関わるものであるが,しかし,データの使い方の工夫だけでは効率化に限界があることも見えてきている.そこで本研究では,明らかに成立する物理的特性を学習に利用することも検討した.対象の正確な物理モデルが得られている場合,そのモデルの知識を利用することで強化学習が高速化できることはよく知られている.しかし,モデル化誤差が存在する場合には,現実には不適切な結果を学習してしまうこともあり,モデルの利用を難しくしている.そこで,運動方程式のような具体的な知見ではなく,より抽象的な知見として,受動性に着目することを考えた.このために,制御理論でよく利用されているポート・ハミルトン系に着目している.この内容についてはまだ基礎的考察にとどまっているものの,研究結果の一部は国際学会誌AROB Journalに掲載されている.

  • 研究成果

    (3件)

すべて 2022 2021

すべて 雑誌論文 (2件) (うち査読あり 2件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] Path Integral Policy Improvement With Population Adaptation2022

    • 著者名/発表者名
      Yamamoto Kosuke、Ariizumi Ryo、Hayakawa Tomohiro、Matsuno Fumitoshi
    • 雑誌名

      IEEE Transactions on Cybernetics

      巻: 52 ページ: 312~322

    • DOI

      10.1109/TCYB.2020.2983923

    • 査読あり
  • [雑誌論文] Port-controlled Hamiltonian based control of snake robots2022

    • 著者名/発表者名
      Ariizumi Ryo、Imagawa Yasuhiro、Asai Toru、Azuma Shun-ichi
    • 雑誌名

      Artificial Life and Robotics

      巻: - ページ: -

    • DOI

      10.1007/s10015-022-00741-2

    • 査読あり
  • [学会発表] ort-Controlled Hamiltonian Approach for Robust Control of Snake Robots2021

    • 著者名/発表者名
      Imagawa Yasuhiro、Ariizumi Ryo、Asai Toru、Azuma Shun-ichi
    • 学会等名
      the 4th International Symposium on Swarm Behavior and Bio-inspired Robotics
    • 国際学会

URL: 

公開日: 2022-12-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi