Project/Area Number |
23K24925
|
Project/Area Number (Other) |
22H03669 (2022-2023)
|
Research Category |
Grant-in-Aid for Scientific Research (B)
|
Allocation Type | Multi-year Fund (2024) Single-year Grants (2022-2023) |
Section | 一般 |
Review Section |
Basic Section 61050:Intelligent robotics-related
|
Research Institution | Kyoto University |
Principal Investigator |
森本 淳 京都大学, 情報学研究科, 教授 (10505986)
|
Co-Investigator(Kenkyū-buntansha) |
中西 淳 名城大学, 理工学部, 教授 (70324457)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2024)
|
Budget Amount *help |
¥17,420,000 (Direct Cost: ¥13,400,000、Indirect Cost: ¥4,020,000)
Fiscal Year 2024: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2023: ¥5,590,000 (Direct Cost: ¥4,300,000、Indirect Cost: ¥1,290,000)
Fiscal Year 2022: ¥6,240,000 (Direct Cost: ¥4,800,000、Indirect Cost: ¥1,440,000)
|
Keywords | 強化学習 / ロボティクス / テレオペレーション / 機械学習 |
Outline of Research at the Start |
本研究課題では、人とロボットの協働を実現するための共有学習制御手法の提案およびロボットを用いたテレオペレーション課題への応用を目的とする。そのために、人とロボットの相互学習を通じて協調的に作業課題が達成されるために必要となる方法論を開発する。具体的には、人とロボットが与えられた課題に対する価値判断を共有することを通じて協働動作が創出され、さらに持続的に改善されるような学習アルゴリズムの開発を目指す。
|
Outline of Annual Research Achievements |
本研究課題では、人とロボットの意思疎通を促す作業価値の共有を実現する方法論として共有学習制御の枠組みの構築を目的とする。ここで作業価値の共有とは、人とロボットが一つの共同作業課題において、各状況・各動作について同様の価値判断(たとえば、状況に応じた互いに同意の得られる動作選択)を行うということである。本研究で開発する強化学習を基礎とした相互学習アルゴリズムによって人とロボットの互いの動作意図共有を進め、ロボットのテレオペレーション課題において提案手法の有効性を評価する。 当該年度においては、人とロボットの価値判断の共有に向けた、ロボットによる人の動作模倣を可能とする学習手法として、多様な動きや動作速度を含む人動作データから模倣を行う方法論の開発をおこなった。Transformerを用いた方策表現により、複数のタスク時系列を有するマニピュレーション課題において、陽に人動作の分節化をおこなうことなくロボットが模倣学習を行うことをシミュレーション環境および実機環境の両方で達成した。また、生活支援ロボットであるモバイルマニピュレータに対し、新規VRデバイスとSDKを用いた遠隔操作システムを構築し、実機への適用を行った。さらにロボット頭部に設置したステレオカメラ画像をVRデバイスに無線通信により送信することで、操作者にロボット周囲の視覚情報の伝達をすることを可能とした。遠隔操作システムの実装においては、VRデバイスで得られる操作者の頭部および手先位置姿勢に基づき、昨年度開発した計算効率を考慮した数値逆運動学解法を用いたロボットの全身自由度の協調制御を実現し、直感的な操作性を実現した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
多様な動きや動作速度を含む人動作データから模倣学習を行う方法論の開発が進捗した。また、遠隔操作システムの開発において概ね順調に進展した。
|
Strategy for Future Research Activity |
今後は、本年度開発した模倣学習手法と遠隔操作システムを統合し、テレオペレーション課題へ適用することで、提案する共有学習制御手法の評価を目指す。
|