• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2023 Fiscal Year Annual Research Report

Development of deep learning to reveal physical human-robot interaction and its application to safe robot control

Research Project

Project/Area Number 20H04265
Research InstitutionNational Institute of Informatics

Principal Investigator

小林 泰介  国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)

Project Period (FY) 2020-04-01 – 2024-03-31
Keywords深層学習 / 潜在空間抽出 / 強化学習
Outline of Annual Research Achievements

本研究では,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術開発を目的としている.これに向けて2023年度では2022年度までの研究を発展させて,i)環境との離散的な接触状況が切り替わる脚ロボットの歩行計画,ii)Sim-to-Real技術の多目的最適化問題としての新解釈,iii)実世界における観測ノイズ・外れ値に頑健な確率的勾配降下法の開発,の3項目を中心に研究を実施した.
i)では,脚ロボットの単脚支持期と両脚支持期,その間に生じる接触事象を別々のアンサンブル型ニューラルネットワークモデルで学習するモデルベース強化学習を開発した.これにより,従来よりも高い予測精度を達成し,着地位置の制約条件を考慮した目標地点までの安定な歩行を実現した.この成果は国際学術論文誌に採録された.
ii)では,Sim-to-Real技術の一つとして知られるドメイン乱択化・適応が各ドメインを別目的とみなすことで多目的強化学習の一種に相当することを示した.それに伴い,多目的強化学習の文脈で開発されていた強化学習アルゴリズムをSim-to-Real技術へと援用することを可能にした.その中でも理論的に優れたアルゴリズムを導入することで,より多くのドメインに汎化して実ロボットへの適用にも成功した.この成果はフラッグシップ国際会議にて発表された.
iii)では,物理的接触を含むような実世界においてセンサからの観測データにノイズ・外れ値が混入しやすい課題に対して,学習に用いる確率的勾配降下法を改めることでノイズ・外れ値に頑健にした.また,ノイズ・外れ値の混入比率や影響度が不確かな中でも,ノイズ・外れ値への頑健性を自動調整するようアルゴリズムを開発した.この成果は国際学術論文誌に採録された.

Research Progress Status

令和5年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和5年度が最終年度であるため、記入しない。

  • Research Products

    (7 results)

All 2024 2023

All Journal Article (4 results) (of which Peer Reviewed: 4 results,  Open Access: 1 results) Presentation (3 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] Constrained footstep planning using model-based reinforcement learning in virtual constraint-based walking2024

    • Author(s)
      Jin Takanori、Kobayashi Taisuke、Matsubara Takamitsu
    • Journal Title

      Advanced Robotics

      Volume: 38 Pages: 525~545

    • DOI

      10.1080/01691864.2024.2336253

    • Peer Reviewed
  • [Journal Article] AdaTerm: Adaptive T-distribution estimated robust moments for Noise-Robust stochastic gradient optimization2023

    • Author(s)
      Ilboudo Wendyam Eric Lionel、Kobayashi Taisuke、Matsubara Takamitsu
    • Journal Title

      Neurocomputing

      Volume: 557 Pages: 126692~126692

    • DOI

      10.1016/j.neucom.2023.126692

    • Peer Reviewed
  • [Journal Article] Reward bonuses with gain scheduling inspired by iterative deepening search2023

    • Author(s)
      Kobayashi Taisuke
    • Journal Title

      Results in Control and Optimization

      Volume: 12 Pages: 100244~100244

    • DOI

      10.1016/j.rico.2023.100244

    • Peer Reviewed / Open Access
  • [Journal Article] Sparse representation learning with modified q-VAE towards minimal realization of world model2023

    • Author(s)
      Kobayashi Taisuke、Watanuki Ryoma
    • Journal Title

      Advanced Robotics

      Volume: 37 Pages: 807~827

    • DOI

      10.1080/01691864.2023.2221715

    • Peer Reviewed
  • [Presentation] Consolidated Adaptive T-soft Update for Deep Reinforcement Learning2024

    • Author(s)
      Kobayashi Taisuke
    • Organizer
      IEEE World Congress on Computational Intelligence
    • Int'l Joint Research
  • [Presentation] Domains as Objectives: Multi-Domain Reinforcement Learning with Convex-Coverage Set Learning for Domain Uncertainty Awareness2023

    • Author(s)
      Ilboudo Wendyam Eric Lionel、Kobayashi Taisuke、Matsubara Takamitsu
    • Organizer
      IEEE/RSJ International Conference on Intelligent Robots and Systems
    • Int'l Joint Research
  • [Presentation] Mirror-Descent Inverse Kinematics with Box-constrained Joint Space2023

    • Author(s)
      Kobayashi Taisuke、Jin Takanori
    • Organizer
      World Congress of the International Federation of Automatic Control
    • Int'l Joint Research

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi