• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

階層型多目的強化学習を用いた脚ロボットの歩容自律生成

研究課題

研究課題/領域番号 17K12759
研究種目

若手研究(B)

配分区分基金
研究分野 知能ロボティクス
研究機関奈良先端科学技術大学院大学

研究代表者

小林 泰介  奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (10796452)

研究期間 (年度) 2017-04-01 – 2020-03-31
研究課題ステータス 完了 (2019年度)
配分額 *注記
4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2019年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2018年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2017年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
キーワード知能ロボティクス / 強化学習 / 多目的最適化 / 継続学習 / 歩行 / 知能ロボティックス
研究成果の概要

本研究は,脚ロボットの歩容運動を階層的な多目的最適化問題として捉えた,歩容の自律学習を目的とした.この技術の確立により,物理的な制約やトレードオフを陽に考慮可能となり,生物の自然な歩容生成が期待できる.
この課題に関連する3つの成果,(1) 継続的に学習結果を蓄積していくことが可能な正則化技術,(2) 大域的な最適解を発見可能な探索力を持つ方策,(3) 知識のモジュール化・階層化を促すニューラルネットワーク,を実現した.これらの技術を4脚ロボットの歩容を下位から上位階層モジュールに分けて順次学習するカリキュラム上で組み合わせ,製作した4脚ロボットのシミュレーションモデルでの歩容生成に成功した.

研究成果の学術的意義や社会的意義

本研究の脚ロボットの学習制御は,近年の入出力関係を直接学習してしまう大雑把なやり方では隠蔽されてしまう知識の階層関係や構成要素を.これまでの歩容に関する研究を踏まえて明示的に与えて継続的に学習を積み重ねていくことが可能な枠組みを提供しており,機械学習分野とロボティクス分野の融合領域として高い学術的意義がある.また,安定かつ高効率な歩容制御の確立はロボットの移動範囲を格段に広げて日常的にロボットが活躍するための基礎技術となり,今後のロボット共生社会の実現に繋がるものと期待できる.

報告書

(4件)
  • 2019 実績報告書   研究成果報告書 ( PDF )
  • 2018 実施状況報告書
  • 2017 実施状況報告書
  • 研究成果

    (10件)

すべて 2019 2018 2017 その他

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (7件) (うち国際学会 3件) 備考 (2件)

  • [雑誌論文] Student-t policy in reinforcement learning to acquire global optimum of robot control2019

    • 著者名/発表者名
      Taisuke Kobayashi
    • 雑誌名

      Applied Intelligence

      巻: 49 号: 12 ページ: 4335-4347

    • DOI

      10.1007/s10489-019-01510-8

    • 関連する報告書
      2019 実績報告書
    • 査読あり
  • [学会発表] Continual Learning Exploiting Structure of Fractal Reservoir Computing2019

    • 著者名/発表者名
      Taisuke Kobayashi and Toshiki Sugino
    • 学会等名
      International Conference on Artificial Neural Networks
    • 関連する報告書
      2019 実績報告書
    • 国際学会
  • [学会発表] フラクタルリザーバコンピューティングを用いた4脚ロボットの階層強化学習2019

    • 著者名/発表者名
      杉野 峻生,小林 泰介,杉本 謙二
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] パラメータの定着とスパース化を統合した正則化による継続学習2019

    • 著者名/発表者名
      小林 泰介
    • 学会等名
      日本ロボット学会学術講演会
    • 関連する報告書
      2019 実績報告書
  • [学会発表] フラクタルリザーバコンピューティングを用いた継続学習2018

    • 著者名/発表者名
      杉野 峻生,小林 泰介,杉本 謙二
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • 関連する報告書
      2018 実施状況報告書
  • [学会発表] Continual Learning using Modularity of Structured Reservoir Computing2018

    • 著者名/発表者名
      Toshiki Sugino, Taisuke Kobayashi, Kenji Sugimoto
    • 学会等名
      SICE Annual Conference
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] Check Regularization: Combining Modularity and Elasticity for Memory Consolidation2018

    • 著者名/発表者名
      Taisuke Kobayashi
    • 学会等名
      International Conference on Artificial Neural Networks
    • 関連する報告書
      2018 実施状況報告書
    • 国際学会
  • [学会発表] 大域的最適解を目指すActor-Critic強化学習2017

    • 著者名/発表者名
      小林 泰介
    • 学会等名
      日本ロボット学会学術講演会
    • 関連する報告書
      2017 実施状況報告書
  • [備考] リザーバコンピューティングを用いた学習内容再利用のための継続階層学習

    • URL

      http://genesis.naist.jp/achievements/m2018_2/

    • 関連する報告書
      2019 実績報告書
  • [備考] オンライン強化学習 | Taisuke Kobayashi

    • URL

      https://kbys_t.gitlab.io/research/reinforcement_learning/

    • 関連する報告書
      2019 実績報告書

URL: 

公開日: 2017-04-28   更新日: 2021-12-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi