2023 Fiscal Year Annual Research Report
Development of deep learning to reveal physical human-robot interaction and its application to safe robot control
Project/Area Number |
20H04265
|
Research Institution | National Institute of Informatics |
Principal Investigator |
小林 泰介 国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | 深層学習 / 潜在空間抽出 / 強化学習 |
Outline of Annual Research Achievements |
本研究では,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術開発を目的としている.これに向けて2023年度では2022年度までの研究を発展させて,i)環境との離散的な接触状況が切り替わる脚ロボットの歩行計画,ii)Sim-to-Real技術の多目的最適化問題としての新解釈,iii)実世界における観測ノイズ・外れ値に頑健な確率的勾配降下法の開発,の3項目を中心に研究を実施した. i)では,脚ロボットの単脚支持期と両脚支持期,その間に生じる接触事象を別々のアンサンブル型ニューラルネットワークモデルで学習するモデルベース強化学習を開発した.これにより,従来よりも高い予測精度を達成し,着地位置の制約条件を考慮した目標地点までの安定な歩行を実現した.この成果は国際学術論文誌に採録された. ii)では,Sim-to-Real技術の一つとして知られるドメイン乱択化・適応が各ドメインを別目的とみなすことで多目的強化学習の一種に相当することを示した.それに伴い,多目的強化学習の文脈で開発されていた強化学習アルゴリズムをSim-to-Real技術へと援用することを可能にした.その中でも理論的に優れたアルゴリズムを導入することで,より多くのドメインに汎化して実ロボットへの適用にも成功した.この成果はフラッグシップ国際会議にて発表された. iii)では,物理的接触を含むような実世界においてセンサからの観測データにノイズ・外れ値が混入しやすい課題に対して,学習に用いる確率的勾配降下法を改めることでノイズ・外れ値に頑健にした.また,ノイズ・外れ値の混入比率や影響度が不確かな中でも,ノイズ・外れ値への頑健性を自動調整するようアルゴリズムを開発した.この成果は国際学術論文誌に採録された.
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|