研究課題/領域番号 |
20H04265
|
研究種目 |
基盤研究(B)
|
配分区分 | 補助金 |
応募区分 | 一般 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 国立情報学研究所 (2023) 奈良先端科学技術大学院大学 (2020-2022) |
研究代表者 |
小林 泰介 国立情報学研究所, 情報学プリンシプル研究系, 助教 (10796452)
|
研究期間 (年度) |
2020-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2022年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
2021年度: 11,830千円 (直接経費: 9,100千円、間接経費: 2,730千円)
2020年度: 2,860千円 (直接経費: 2,200千円、間接経費: 660千円)
|
キーワード | 深層学習 / 強化学習 / 潜在空間抽出 / 確率的勾配降下法 / ヒューマンロボットインタラクション / 世界モデル |
研究開始時の研究の概要 |
本研究では,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術を提案する.そのために,ロボットとヒトとの身体的相互作用に関して潜在的に重要な情報を低次元の潜在空間へと抽出する深層学習技術を開発する.また,得られた潜在空間を活用して,ロボットがヒトとどのように身体的相互作用すれば良いのかを計画あるいは予測して行動するような学習型制御技術を開発する.これらの基盤技術を組み合わせることで,ロボットとヒトとの物理的接触を特定のシーンのみでなく汎用的に達成することを目指す.
|
研究成果の概要 |
本研究は,多自由度系のロボットとヒトとの物理的接触を安全にするための学習制御技術を開発するものである.この課題に関連して主に,i)ツァリス統計に基づく整った潜在空間の抽出技術,ii)強化学習による行動の平滑化技術,iii)Sim-to-Realの多目的強化学習としての新理論,iv)ノイズ・外れ値に頑健な確率的勾配降下法,の4つの技術的成果と,i)ヒトとロボットの間接的な物理的接触を含む周期動作の解析,ii)離散的に接触状況が変わる脚ロボットの歩行計画,の2つの応用に成功した.
|
研究成果の学術的意義や社会的意義 |
本研究の技術的成果はどれも,本研究の想定する物理的接触を含む問題を通じて開発された一方で,それのみで機能するような限定的に組み立てられた技術ではなく,より多くの問題での活躍が期待されるような理論的かつ汎用的なものとなっている.これは,実用性を志向することで機械学習分野に広がりをもたらし,高い学術的意義がある.また,これらの技術やその開発を通じて得られた知見により,物理的接触を含むような実ロボットの制御やインタラクションの解析などを達成しており,従来よりも複雑な社会的に需要のある作業へのロボット導入へと繋がるものと期待できる.
|