研究課題/領域番号 |
23K24925
|
補助金の研究課題番号 |
22H03669 (2022-2023)
|
研究種目 |
基盤研究(B)
|
配分区分 | 基金 (2024) 補助金 (2022-2023) |
応募区分 | 一般 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 京都大学 |
研究代表者 |
森本 淳 京都大学, 情報学研究科, 教授 (10505986)
|
研究分担者 |
中西 淳 名城大学, 理工学部, 教授 (70324457)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2024年度)
|
配分額 *注記 |
17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)
2024年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2023年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円)
2022年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
|
キーワード | 強化学習 / ロボティクス / テレオペレーション / 機械学習 |
研究開始時の研究の概要 |
本研究課題では、人とロボットの協働を実現するための共有学習制御手法の提案およびロボットを用いたテレオペレーション課題への応用を目的とする。そのために、人とロボットの相互学習を通じて協調的に作業課題が達成されるために必要となる方法論を開発する。具体的には、人とロボットが与えられた課題に対する価値判断を共有することを通じて協働動作が創出され、さらに持続的に改善されるような学習アルゴリズムの開発を目指す。
|
研究実績の概要 |
本研究課題では、人とロボットの意思疎通を促す作業価値の共有を実現する方法論として共有学習制御の枠組みの構築を目的とする。ここで作業価値の共有とは、人とロボットが一つの共同作業課題において、各状況・各動作について同様の価値判断(たとえば、状況に応じた互いに同意の得られる動作選択)を行うということである。本研究で開発する強化学習を基礎とした相互学習アルゴリズムによって人とロボットの互いの動作意図共有を進め、ロボットのテレオペレーション課題において提案手法の有効性を評価する。 当該年度においては、人とロボットの価値判断の共有に向けた、ロボットによる人の動作模倣を可能とする学習手法として、多様な動きや動作速度を含む人動作データから模倣を行う方法論の開発をおこなった。Transformerを用いた方策表現により、複数のタスク時系列を有するマニピュレーション課題において、陽に人動作の分節化をおこなうことなくロボットが模倣学習を行うことをシミュレーション環境および実機環境の両方で達成した。また、生活支援ロボットであるモバイルマニピュレータに対し、新規VRデバイスとSDKを用いた遠隔操作システムを構築し、実機への適用を行った。さらにロボット頭部に設置したステレオカメラ画像をVRデバイスに無線通信により送信することで、操作者にロボット周囲の視覚情報の伝達をすることを可能とした。遠隔操作システムの実装においては、VRデバイスで得られる操作者の頭部および手先位置姿勢に基づき、昨年度開発した計算効率を考慮した数値逆運動学解法を用いたロボットの全身自由度の協調制御を実現し、直感的な操作性を実現した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
多様な動きや動作速度を含む人動作データから模倣学習を行う方法論の開発が進捗した。また、遠隔操作システムの開発において概ね順調に進展した。
|
今後の研究の推進方策 |
今後は、本年度開発した模倣学習手法と遠隔操作システムを統合し、テレオペレーション課題へ適用することで、提案する共有学習制御手法の評価を目指す。
|