研究課題/領域番号 |
22K14214
|
研究種目 |
若手研究
|
配分区分 | 基金 |
審査区分 |
小区分20020:ロボティクスおよび知能機械システム関連
|
研究機関 | 筑波大学 |
研究代表者 |
赤川 徹朗 筑波大学, システム情報系, 研究員 (80910728)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2022年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2024年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2023年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2022年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
|
キーワード | 模倣学習 / マルチモーダル / 局所的通信 / 赤外線通信 / 自己組織ロボット |
研究開始時の研究の概要 |
本研究は、自律分散制御に基づく自己組織ロボットにおいて集合/変形を実現させるための通信デバイスおよび通信制御アルゴリズムを提案する。これらの集団行動を自律分散制御に基づいて実現するためには、群の中から集団行動に必要な台数のロボットにのみ行動目的を共有させる手段が必要である。本研究は、各ロボットに搭載した局所的通信を介して連鎖的に情報伝達を繰り返すことで、集合/変形の意思を複数のロボット間で共有する通信制御を実現する。
|
研究実績の概要 |
本研究は生物の自己組織化のメカニズムを模倣するロボットシステムを実現することで,自律分散管理における集合体の意思決定メカニズムを明らかにすることが目的である.かねてより開発してきた赤外線デバイスを用いた細胞性粘菌の特性の再現は計画されているが,観測情報に基づく自己組織化を実現する行動選択は明らかでなかった.この行動選択について独自の行動ルールを作り込んでしまえば,明らかにするはずであった集団の自律性についてのメカニズムに研究者の先入観が紛れ込んでしまう恐れがある.したがって,本研究ではこの行動ルールに機械学習を用いることを考え,本年度は本研究に適した機械学習の学習モデルを模索する研究活動に取り組んだ. 本研究課題では細胞性粘菌の行動を模倣するシステムを開発するため,まずは模倣学習についての知見を収集する必要があった.また,都合よく本研究課題とは別に模倣学習を用いたロボットの動作生成の研究プロジェクトに参加していたため,そこでの研究活動と合わせて自己組織ロボットに活用する手段を模索した.これらの研究活動では,ロボットの応答値から指令値を予測する学習モデルの研究開発に従事したが,開発する学習モデルを自己組織ロボットへ転用することを考慮し,制御対象のロボットの時系列データと制御対象外の独立して行動する対象物の時系列の観測データを組み合わせた学習モデルを実現するべく研究活動に取り組んだ.これは,自己組織化において,制御対象である個々の自律分散型ロボットは,周囲に存在する他ロボットの観測データに基づいて自身の行動を選択しなければならない状況への転用を想定した学習モデルである.この学習に則した目標タスクとして,本年度は画像から得られた座標情報からロボット動作の行動選択を行うタスクを設定し,これら学習モデルの基本形を完成させる研究成果が得られた.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
前述の通り,本年度では研究課題である自律分散型ロボットの行動選択に深層学習を取り入れる手法を模索した.従来の模倣学習のモデルに制御対象の時系列データと制御対象外の時系列データを同時に与えただけでは,簡単な問題を設定しない限りその関係性を理解する負担が大きく,正確な予測が困難であることが事前実験の研究活動から明らかとなった.この問題に対し,本研究は階層型学習モデルを用いた.この階層型学習モデルは上位モデルと下位モデルの二つの学習モデルを用いて学習する手法である.こうすることで制御対象内外の関係性を理解する負担を,二つのモデルに分担することが可能となることが研究活動から明らかとなった.しかし,この階層モデルに欠点が存在することが同時に明らかとされた.それは,階層型学習モデルから負担を軽減させても制御対象内外の関係性を理解することは難しいという問題が生じた.この問題を解決するべく,Attention機構を組み込んだF-L attention modelや,さらに学習の負担を下げるべく直近の動作の差分のみを予測するF-L difference modelなど様々なモデルを実装して検証を進めたが,根本的な解決手法とはならなかった.最終的に,予測する制御対象の動作のLOSSをセンサが得られる制御外の時系列データの表現に合わせる学習手法を検証し,これまでの学習結果で最も良い予測結果が得られた.その結果,ベルトコンベア上を流れる物体のピックアンドプレイスにおいて,コンベア上の把持対象の位置に合わせてロボットアームが把持位置を切り替え,把持対象がアームロボットの下に流れついたタイミングに合わせて把持動作の行動を選択するタスクを達成させた.現在は,これらの研究成果を関連研究の学習と比較できるように整理した上で実験データの再収集に取り組んでおり,論文誌への投稿する準備を進めている.
|
今後の研究の推進方策 |
今後は大きく三つに分けての研究活動に取り組む方針である. 一つ目は,赤外線センシング装置の改良である.研究代表者は,本研究が課題とする自己組織化を実現する上で,核となる技術である赤外線センシング装置を用いた通信システムを開発してきた.しかし,この赤外線センシング装置は,まだ実現する自己組織ロボットの役割からして,必要以上に大きな構造を持つ装置である.また,このセンシングの精度も二次元平面上では距離と方向を計測できるが,計測装置が傾くと精度が大きく低下する問題も存在する.したがって,本年度は,この赤外線センシング装置のさらなる小型化と計測精度向上に取り組む計画である. 二つ目は,全周方向から連結が可能な自己組織ロボットの開発である.本研究課題において細胞性粘菌の性質を再現することが目的にある.すなわち,どの方向からも自由に集合/分離が可能な細胞性粘菌の特性を備えた自己組織ロボットが求められる.また,赤外線センシング装置が全周方向に対してシームレスな通信/計測が可能である利点を活用する上でも重要である.現在の進捗としては,オムニホイールによる全方向移動ロボットの本体および制御回路は用意できている.したがって,今後は全周方向から容易に連結が可能な機構を台車に搭載する作業を進める. 三つ目としては,自律分散制御に基づく自己組織化の制御である.この制御には機械学習を取り入れる計画である.理想としては再現対象の細胞性粘菌の行動を記録し,その情報を教師データとして用いて学習を進めることである.しかし,残された研究期間から実測した教師データの収集作業に取り組むことは難しい.したがって,本年度から得られた研究成果に基づいて,疑似的な教師データおよび環境設定から入力する制御対象のロボットと制御対象外のロボットの記録データを近い表現形式に変換した後に,機械学習から行動を獲得する手法を模索する.
|