• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

階層型多目的強化学習を用いた脚ロボットの歩容自律生成

研究課題

研究課題/領域番号 17K12759
研究機関奈良先端科学技術大学院大学

研究代表者

小林 泰介  奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (10796452)

研究期間 (年度) 2017-04-01 – 2020-03-31
キーワード知能ロボティクス / 強化学習 / 多目的最適化 / 歩行
研究実績の概要

本研究は,脚ロボットの歩容運動を階層的な多目的最適化問題として捉えた,歩容の自律学習を目的としている.この技術の確立により,物理的な制約やトレードオフを陽に考慮した学習が可能となり,生物のような自然な歩容生成が期待できる.
最終年度では,1)多目的最適化問題を扱う際に陥りやすい局所解を回避して大域的最適解を発見しうる方策の解析・評価,2)多目的最適化を扱うための複数のタスクを順番に学習していくことの可能な継続学習の改良・評価,3)4脚ロボットの改良,の3点に重点を置いて研究を実施した.
具体的には,1)について,2017年度に提案したスチューデントのt分布を用いた方策の解析を進めるとともに勾配の補正を加えて動力学シミュレーション上にて従来手法との統計的な比較検証を実施した.結果として,提案手法が安定して大域的最適解を発見しやすいことを示した.この成果は査読あり国際論文誌に1編掲載された.
2)について,2018年度に提案したニューラルネットワークの正則化手法を簡略化して計算コストを削減した手法を新たに提案した.この成果は査読なし国内会議で1件発表した.また,モジュール性を与えるためのフラクタルネットワークに基づいた設計手法について設計の改善に努め,より多くのタスクを継続して学習していくことができることを示した.この成果は査読なし国内会議で1件,査読あり国際会議で1件発表した.
3)について,接触力の影響が他の脚へとより顕著に出るように,体幹部に柔軟に曲がる背骨構造を採用して設計・開発した.
研究期間全体を通じて,査読なし国内会議で4件,査読あり国際会議で3件発表し,査読あり国際論文誌に1編掲載された.また新たに国際論文誌に1編投稿し,現在査読中である.

  • 研究成果

    (6件)

すべて 2019 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (3件) (うち国際学会 1件) 備考 (2件)

  • [雑誌論文] Student-t policy in reinforcement learning to acquire global optimum of robot control2019

    • 著者名/発表者名
      Taisuke Kobayashi
    • 雑誌名

      Applied Intelligence

      巻: 49 ページ: 4335-4347

    • DOI

      10.1007/s10489-019-01510-8

    • 査読あり
  • [学会発表] Continual Learning Exploiting Structure of Fractal Reservoir Computing2019

    • 著者名/発表者名
      Taisuke Kobayashi and Toshiki Sugino
    • 学会等名
      International Conference on Artificial Neural Networks
    • 国際学会
  • [学会発表] フラクタルリザーバコンピューティングを用いた4脚ロボットの階層強化学習2019

    • 著者名/発表者名
      杉野 峻生,小林 泰介,杉本 謙二
    • 学会等名
      ロボティクス・メカトロニクス講演会
  • [学会発表] パラメータの定着とスパース化を統合した正則化による継続学習2019

    • 著者名/発表者名
      小林 泰介
    • 学会等名
      日本ロボット学会学術講演会
  • [備考] リザーバコンピューティングを用いた学習内容再利用のための継続階層学習

    • URL

      http://genesis.naist.jp/achievements/m2018_2/

  • [備考] オンライン強化学習 | Taisuke Kobayashi

    • URL

      https://kbys_t.gitlab.io/research/reinforcement_learning/

URL: 

公開日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi