作業価値関数の相互獲得を通じた人とロボットの共有学習制御手法の開発

研究課題

研究課題/領域番号	23K24925
補助金の研究課題番号	22H03669 (2022-2023)
研究種目	基盤研究(B)
配分区分	基金 (2024) 補助金 (2022-2023)
応募区分	一般
審査区分	小区分61050:知能ロボティクス関連
研究機関	京都大学
研究代表者	森本淳京都大学, 情報学研究科, 教授 (10505986)
研究分担者	中西淳名城大学, 理工学部, 教授 (70324457)
研究期間 (年度)	2022-04-01 – 2025-03-31
研究課題ステータス	交付 (2024年度)
配分額 *注記	17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円) 2024年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円) 2023年度: 5,590千円 (直接経費: 4,300千円、間接経費: 1,290千円) 2022年度: 6,240千円 (直接経費: 4,800千円、間接経費: 1,440千円)
キーワード	強化学習 / ロボティクス / テレオペレーション / 機械学習
研究開始時の研究の概要	本研究課題では、人とロボットの協働を実現するための共有学習制御手法の提案およびロボットを用いたテレオペレーション課題への応用を目的とする。そのために、人とロボットの相互学習を通じて協調的に作業課題が達成されるために必要となる方法論を開発する。具体的には、人とロボットが与えられた課題に対する価値判断を共有することを通じて協働動作が創出され、さらに持続的に改善されるような学習アルゴリズムの開発を目指す。
研究実績の概要	本研究課題では、人とロボットの意思疎通を促す作業価値の共有を実現する方法論として共有学習制御の枠組みの構築を目的とする。ここで作業価値の共有とは、人とロボットが一つの共同作業課題において、各状況・各動作について同様の価値判断（たとえば、状況に応じた互いに同意の得られる動作選択）を行うということである。本研究で開発する強化学習を基礎とした相互学習アルゴリズムによって人とロボットの互いの動作意図共有を進め、ロボットのテレオペレーション課題において提案手法の有効性を評価する。当該年度においては、人とロボットの価値判断の共有に向けた、ロボットによる人の動作模倣を可能とする学習手法として、多様な動きや動作速度を含む人動作データから模倣を行う方法論の開発をおこなった。Transformerを用いた方策表現により、複数のタスク時系列を有するマニピュレーション課題において、陽に人動作の分節化をおこなうことなくロボットが模倣学習を行うことをシミュレーション環境および実機環境の両方で達成した。また、生活支援ロボットであるモバイルマニピュレータに対し、新規VRデバイスとSDKを用いた遠隔操作システムを構築し、実機への適用を行った。さらにロボット頭部に設置したステレオカメラ画像をVRデバイスに無線通信により送信することで、操作者にロボット周囲の視覚情報の伝達をすることを可能とした。遠隔操作システムの実装においては、VRデバイスで得られる操作者の頭部および手先位置姿勢に基づき、昨年度開発した計算効率を考慮した数値逆運動学解法を用いたロボットの全身自由度の協調制御を実現し、直感的な操作性を実現した。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由多様な動きや動作速度を含む人動作データから模倣学習を行う方法論の開発が進捗した。また、遠隔操作システムの開発において概ね順調に進展した。
今後の研究の推進方策	今後は、本年度開発した模倣学習手法と遠隔操作システムを統合し、テレオペレーション課題へ適用することで、提案する共有学習制御手法の評価を目指す。

報告書

(2件)

2023 実績報告書
2022 実績報告書

研究成果
(5件)

すべて 2024 2023 その他

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち国際共著 1件、査読あり 2件、オープンアクセス 2件) 学会発表 (2件)

[国際共同研究] The Jozef Stefan Institute(スロベニア)
- 関連する報告書
  2023 実績報告書
[雑誌論文] GAN-Based Semi-Supervised Training of LSTM Nets for Intention Recognition in Cooperative Tasks2024
- 著者名/発表者名
  Matija Mavsar, Jun Morimoto, Ales Ude
- 雑誌名
  
  IEEE ROBOTICS AND AUTOMATION LETTERS
  
  巻: 9 号: 1 ページ: 263-270
- DOI
  10.1109/lra.2023.3333231
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス / 国際共著
[雑誌論文] Curriculum-based humanoid robot identification using large-scale human motion database2023
- 著者名/発表者名
  Sunhwi Kang, Koji Ishihara, Norikazu Sugimoto, Jun Morimoto
- 雑誌名
  
  Frontiers in Robotics and AI
  
  巻: 10 ページ: 1-13
- DOI
  10.3389/frobt.2023.1282299
- 関連する報告書
  2023 実績報告書
- 査読あり / オープンアクセス
[学会発表] 多様な動作速度を含むエキスパートデータからの行動クローニング2023
- 著者名/発表者名
  角田日維、八木聡明、山森聡、森本淳
- 学会等名
  第26回情報論的学習理論ワークショップ（IBIS2023）
- 関連する報告書
  2023 実績報告書
[学会発表] 目的条件付け終端価値推定とそれを用いたモデル予測制御2023
- 著者名/発表者名
  森田光紀、山森聡、八木聡明、杉本徳和、森本淳
- 学会等名
  第26回情報論的学習理論ワークショップ（IBIS2023）
- 関連する報告書
  2023 実績報告書

作業価値関数の相互獲得を通じた人とロボットの共有学習制御手法の開発

研究代表者

森本 淳 京都大学, 情報学研究科, 教授 (10505986)

17,420千円 (直接経費: 13,400千円、間接経費: 4,020千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] The Jozef Stefan Institute(スロベニア)

関連する報告書

[雑誌論文] GAN-Based Semi-Supervised Training of LSTM Nets for Intention Recognition in Cooperative Tasks2024

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Curriculum-based humanoid robot identification using large-scale human motion database2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] 多様な動作速度を含むエキスパートデータからの行動クローニング2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 目的条件付け終端価値推定とそれを用いたモデル予測制御2023

著者名/発表者名

学会等名

関連する報告書

森本淳京都大学, 情報学研究科, 教授 (10505986)