研究課題/領域番号 |
20KK0256
|
研究種目 |
国際共同研究加速基金(国際共同研究強化(A))
|
配分区分 | 基金 |
審査区分 |
小区分20020:ロボティクスおよび知能機械システム関連
|
研究機関 | 東北大学 |
研究代表者 |
林部 充宏 東北大学, 工学研究科, 教授 (40338934)
|
研究期間 (年度) |
2021 – 2023
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
11,700千円 (直接経費: 9,000千円、間接経費: 2,700千円)
|
キーワード | 運動学習 / 模倣学習 / 深層強化学習 / 同期現象 / 運動シナジー / CPG / 環境適応 / 運動制御 |
研究開始時の研究の概要 |
本研究の基課題は、環境適応可能なリズミックな運動生成をどのような計算方法で実現できるかという環境協調運動制御メカニズムを解明するものである。環境情報が未知でも、人間が関節間の協調運動を学習アルゴリズムで発現することができる手法を開発している。四足歩行動作ではその運動学習法の有効性を示すことができたが、本国際共同研究ではさらに一歩進んで、一般的な身体モデルの同期現象の学習による生成モデルへと拡張し、多自由度の同期現象を統一的に理解する数理モデルを構築する。またヒトの運動学習特性を再現できるかどうかも検証する必要性があり、その実現に向け国際共同研究を行う。
|
研究成果の概要 |
本研究の基課題「環境モデルや振動子モデルに依存しない環境適応学習による多様な運動の発現機序」は、環境適応可能なリズミックな運動生成をどのような計算方法で実現できるかという環境協調運動制御メカニズムを解明するものである。本国際共同研究により3つの観点で人間の環境適応学習法の数理解析と検証による統一的理解につながる成果を得ることができた。イタリアのd'Avella教授とは全身の運動シナジー構造発現プロセスの理解と再現に関する成果、英国のBurdet教授とは触覚情報の共有による運動学習の効率化に関する成果、スイスのIjspeert教授とは生物の動きを模倣する生成AIの基盤技術を開発することができた。
|
研究成果の学術的意義や社会的意義 |
近年、深層強化学習や模倣学習をそれぞれ用いたロボット制御の応用研究が活発に行われ注目されています。深層強化学習を活用する場合には環境適応可能な運動が生成できるものの、広大な入力空間の探索に膨大な計算コストを要することが問題となります。一方、模倣学習を用いる場合には学習した運動に近い範囲に環境適応性が制限されるという問題が一般的に知られています。今回の提案手法は深層強化学習と模倣学習の両面の利点を生かすことができ、またその欠点を補いあうことができる新しい運動生成の手法となり、多自由度系で生体の自己組織的な振る舞いの生成をAIにより実装する技術につながります。
|