• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実績報告書

ヒトとの物理的接触モデルを紐解く深層学習の開発と安全なロボット制御への応用

研究課題

研究課題/領域番号 20H04265
研究機関国立情報学研究所

研究代表者

小林 泰介  国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワード深層学習 / 潜在空間抽出 / 強化学習
研究実績の概要

本研究では,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術開発を目的としている.これに向けて2023年度では2022年度までの研究を発展させて,i)環境との離散的な接触状況が切り替わる脚ロボットの歩行計画,ii)Sim-to-Real技術の多目的最適化問題としての新解釈,iii)実世界における観測ノイズ・外れ値に頑健な確率的勾配降下法の開発,の3項目を中心に研究を実施した.
i)では,脚ロボットの単脚支持期と両脚支持期,その間に生じる接触事象を別々のアンサンブル型ニューラルネットワークモデルで学習するモデルベース強化学習を開発した.これにより,従来よりも高い予測精度を達成し,着地位置の制約条件を考慮した目標地点までの安定な歩行を実現した.この成果は国際学術論文誌に採録された.
ii)では,Sim-to-Real技術の一つとして知られるドメイン乱択化・適応が各ドメインを別目的とみなすことで多目的強化学習の一種に相当することを示した.それに伴い,多目的強化学習の文脈で開発されていた強化学習アルゴリズムをSim-to-Real技術へと援用することを可能にした.その中でも理論的に優れたアルゴリズムを導入することで,より多くのドメインに汎化して実ロボットへの適用にも成功した.この成果はフラッグシップ国際会議にて発表された.
iii)では,物理的接触を含むような実世界においてセンサからの観測データにノイズ・外れ値が混入しやすい課題に対して,学習に用いる確率的勾配降下法を改めることでノイズ・外れ値に頑健にした.また,ノイズ・外れ値の混入比率や影響度が不確かな中でも,ノイズ・外れ値への頑健性を自動調整するようアルゴリズムを開発した.この成果は国際学術論文誌に採録された.

現在までの達成度 (段落)

令和5年度が最終年度であるため、記入しない。

今後の研究の推進方策

令和5年度が最終年度であるため、記入しない。

  • 研究成果

    (7件)

すべて 2024 2023

すべて 雑誌論文 (4件) (うち査読あり 4件、 オープンアクセス 1件) 学会発表 (3件) (うち国際学会 3件)

  • [雑誌論文] Constrained footstep planning using model-based reinforcement learning in virtual constraint-based walking2024

    • 著者名/発表者名
      Jin Takanori、Kobayashi Taisuke、Matsubara Takamitsu
    • 雑誌名

      Advanced Robotics

      巻: 38 ページ: 525~545

    • DOI

      10.1080/01691864.2024.2336253

    • 査読あり
  • [雑誌論文] AdaTerm: Adaptive T-distribution estimated robust moments for Noise-Robust stochastic gradient optimization2023

    • 著者名/発表者名
      Ilboudo Wendyam Eric Lionel、Kobayashi Taisuke、Matsubara Takamitsu
    • 雑誌名

      Neurocomputing

      巻: 557 ページ: 126692~126692

    • DOI

      10.1016/j.neucom.2023.126692

    • 査読あり
  • [雑誌論文] Reward bonuses with gain scheduling inspired by iterative deepening search2023

    • 著者名/発表者名
      Kobayashi Taisuke
    • 雑誌名

      Results in Control and Optimization

      巻: 12 ページ: 100244~100244

    • DOI

      10.1016/j.rico.2023.100244

    • 査読あり / オープンアクセス
  • [雑誌論文] Sparse representation learning with modified q-VAE towards minimal realization of world model2023

    • 著者名/発表者名
      Kobayashi Taisuke、Watanuki Ryoma
    • 雑誌名

      Advanced Robotics

      巻: 37 ページ: 807~827

    • DOI

      10.1080/01691864.2023.2221715

    • 査読あり
  • [学会発表] Consolidated Adaptive T-soft Update for Deep Reinforcement Learning2024

    • 著者名/発表者名
      Kobayashi Taisuke
    • 学会等名
      IEEE World Congress on Computational Intelligence
    • 国際学会
  • [学会発表] Domains as Objectives: Multi-Domain Reinforcement Learning with Convex-Coverage Set Learning for Domain Uncertainty Awareness2023

    • 著者名/発表者名
      Ilboudo Wendyam Eric Lionel、Kobayashi Taisuke、Matsubara Takamitsu
    • 学会等名
      IEEE/RSJ International Conference on Intelligent Robots and Systems
    • 国際学会
  • [学会発表] Mirror-Descent Inverse Kinematics with Box-constrained Joint Space2023

    • 著者名/発表者名
      Kobayashi Taisuke、Jin Takanori
    • 学会等名
      World Congress of the International Federation of Automatic Control
    • 国際学会

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi