研究課題/領域番号 |
23K16973
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分61050:知能ロボティクス関連
|
研究機関 | 奈良先端科学技術大学院大学 |
研究代表者 |
鶴峯 義久 奈良先端科学技術大学院大学, 先端科学技術研究科, 助教 (00908113)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 520千円 (直接経費: 400千円、間接経費: 120千円)
2023年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
|
キーワード | 階層方策 / 深層強化学習 / マニピュレーション / 強化学習 / 動作計画 / 知能ロボティクス |
研究開始時の研究の概要 |
階層方策は複数のサブタスクに分けることで家事や仕事のような長期タスクを実現可能であるが、設計コストが高く様々なタスクに適用することは困難である。本研究は階層方策の設計コストを下げ、多様なタスクを実行可能な階層方策フレームワークの開発を目指す。具体的には、上位層と下位層の抽象度ギャップを削減する画像補助情報を設計し、階層間の設計が不十分な階層方策でもタスク実行が可能となる。そのような画像補助情報の設計方法や具体的な性能を明らかにすることが目標である。さらに、実ロボットタスクにて提案手法が長期タスクを実行可能か検証する。
|
研究実績の概要 |
該当年度は主に学習に利用する並列シミュレーション環境の構築や提案手法の設計について取り組んだ。まず本研究では大量のデータを高速に収集できるシミュレーション環境のために並列シミュレーション環境の構築に着手した。これにより手法の開発や検証、パラメータ調整等の作業のボトルネックとなるデータ収集の効率化や、大規模データからの学習による性能向上を図った。さらに並列シミュレーション環境での学習効率を改善するため、ロボットの一部機能を並列化することでシミュレーション速度効率を高めた。これらの取り組みにより、限られた計算資源でもデータ収集のスループットを大幅に向上させることに成功した。並列シミュレーション環境構築に関する成果をまとめ、第41回日本ロボット学会学術講演会(RSJ2023)で発表した。並列シミュレーション環境の構築によりデータ収集コストを抑えることができ、データ規模が大きい学習設定を試しやすくなった。
提案手法の設計については、当初の計画では人間が設計した画像補助情報の影響調査を行った後に、抽象度ギャップを削減する画像補助情報の生成モデル学習に取り組む2段階の計画であった。この2つ計画を並列に取り組むことで、最終的な目的である抽象度ギャップを削減する画像補助情報の生成モデル学習にも早期から取り組み、研究の効率化を図ることとした。この計画変更により、該当年度は従来研究の調査を進めながら、提案手法の設計や先行研究の試用を中心に研究を進めた。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
効率よくデータを収集するために並列シミュレータ環境を開発した。具体的にはGPUを利用した高速な並列環境シミュレータであるIsaac gymを用い、モバイルマニピュレータのpick-and-place環境を構築した。また、並列シミュレーション環境のサンプル効率を維持しつつマニピュレーションタスクの学習を簡略化するために、一部の機能を並列化した。その並列化した機能は目標手先姿勢から各関節の角度を計算する逆運動学であり、この並列化によりサンプル効率の低下を抑えつつロボットの行動空間を関節角度から手先移動に変更することが可能となった。この並列高速シミュレーション環境の構築により今後の提案手法の開発や検証を効率的に進めることができるようになった。
本研究の研究目的は、階層方策において上位層から下位層に潜在画像を入力する場合に適した潜在画像や階層構造を明らかにすることである。具体的には様々なオブジェクトを扱う長期タスクにおいて、オブジェクトセントリックなセグメンテーションを行うことで様々なオブジェクトを扱えるようにする。この様な階層方策を実ロボットシステムで実現するためには、リアルタイムに実行可能なセグメンテーションが必要であり、それらに関する従来研究の調査やそのプログラムの試用を実施した。また、セグメンテーションに関する基盤モデルについても調査や試用を実施し、セグメンテーション画像を含む階層方策の設計を試みた。
|
今後の研究の推進方策 |
主な課題は階層方策で用いる潜在画像において、上位層が指定する対象オブジェクトと周囲環境のオブジェクトの対応を関係付けるシンボルグラウンディングである。上位方策の出力は抽象的な行動とその行動に関係するオブジェクトであり、上位方策が対象とするオブジェクトを選択する必要がある。しかし、家庭のような様々なオブジェクトが存在する環境においては、タスクに関係ないオブジェクトが無数に存在するため、タスクに関係あるオブジェクトとの対応付けが困難である。そこで本研究ではSegmentaion Anything Modelという画像内に写る様々なオブジェクトをセグメンテーション可能な基盤モデルを用いることで、オブジェクト候補を抽出し、その中のオブジェクトから上位方策がオブジェクトを選択する手法の提案を目指す。
|