2023 Fiscal Year Annual Research Report
人型ロボットによるヒトのバランス制御と空中感覚理解
Project/Area Number |
20H04267
|
Research Institution | Waseda University |
Principal Investigator |
橋本 健二 早稲田大学, 理工学術院(情報生産システム研究科・センター), 教授 (10449340)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | ヒューマノイド / 人型ロボット / 脚型ロボット |
Outline of Annual Research Achievements |
本研究では,ヒトの運動制御系をモデル化し,人型ロボットへの実装を通して,ヒトのバランス制御を理解することを目的とする.最終年度となる令和5年度は,以下の2点について研究を推進した. (1) 経験型強化学習を用いた2足ロボットの運動生成:強化学習においてエージェントに期待通りの行動を獲得させるためには適切な報酬設計が必要となる.本研究では,報酬と罰に重みを設けず,それぞれを別種の信号として扱う経験型強化学習に注目した.経験型強化学習には合理的政策形成アルゴリズムと罰回避政策形成アルゴリズムの2種類の枠組みがある.合理的政策形成アルゴリズムは単位行動あたりの期待獲得報酬が正になるように学習し,罰回避政策形成アルゴリズムは単位行動あたりの期待獲得罰が0になるように学習する.本研究では合理的政策形成アルゴリズムProfit Sharing(PS)と予想失敗確率(Expected Failure Probability:EFP)を組み合わせたPS with EFPを採用した.シミュレーションを通して,2足ロボットのモデルとして用いられる倒立振子が安定して倒立できることを確認し,2足ロボットのモデルにも提案手法を適用した. (2) 節間協調の平面則に基づく2足ロボットの歩行運動生成:ヒトに見られる特徴的な歩容として運動学シナジー(節間協調の平面則)がある.節間協調の平面則とは,矢状面内での大腿部・下腿部・足部の仰角を3軸として角度データをプロットすると1つの平面に載るというものである.この特徴を強化学習の報酬として導入することにより,2足ロボットが踵から着地し,つま先から離地するヒトらしい2足歩行を実現した.また,この特徴を使用しない時の歩行運動の学習結果と比較したところ,節間協調の平面則が踵接地爪先離地歩行というヒトの歩行動作を特徴づける要因の1つであることが示唆された.
|
Research Progress Status |
令和5年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和5年度が最終年度であるため、記入しない。
|
Research Products
(7 results)