• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2021 年度 研究成果報告書

統計的機械学習の手法を用いたデータ駆動型非線形準最適制御

研究課題

  • PDF
研究課題/領域番号 19K20375
研究種目

若手研究

配分区分基金
審査区分 小区分61050:知能ロボティクス関連
研究機関名古屋大学

研究代表者

有泉 亮  名古屋大学, 工学研究科, 助教 (30775143)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワード強化学習 / ロボティクス / 制御工学
研究成果の概要

ロボットなどへの応用を念頭に,比較的少ない実験回数で最適な制御入力を得る強化学習則を目指し研究を行った.特に,ロボットの強化学習法として知られるPI2と呼ばれる強化学習則の応用を中心に検討した.これにより,従来の強化学習法では学習困難であった脚ロボットの転倒状態からの起き上がり動作の習得など,困難なタスクを数千回程度の実験結果をもとに達成することに成功している.また,制御工学の知見を応用することにより,より効率よく学習を行うための基礎的な検討を行った.

自由記述の分野

ロボティクス

研究成果の学術的意義や社会的意義

強化学習の有効性は様々な分野で明らかになってきているが,多自由度ロボットの強化学習は状態や入力が連続値であることもあり,タスクによっては数十万回に及ぶ実験が必要となるなど,まだ実用に足る効率は発揮できていない.本研究ではデータ効率の向上を目的に,データの使い方の工夫を提案した.また,データの工夫だけでは効率化に限界がある.そこで,明らかに成立する物理的性質を学習に取り入れることを考え,その実現のための基礎的検討を行った.これらは,今後さらに強化学習の効率を向上させ,多自由度ロボットの強化学習のデータ効率を実用的なレベルに引き上げるための基礎となりうる.

URL: 

公開日: 2023-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi