2022 年度実施状況報告書

生物の集団意思決定を模倣する自律分散自己組織ロボットの集合／変形メカニズムの実現

研究課題

研究課題/領域番号	22K14214
研究機関	筑波大学
研究代表者	赤川徹朗筑波大学, システム情報系, 研究員 (80910728)
研究期間 (年度)	2022-04-01 – 2025-03-31
キーワード	模倣学習 / マルチモーダル
研究実績の概要	本研究は生物の自己組織化のメカニズムを模倣するロボットシステムを実現することで，自律分散管理における集合体の意思決定メカニズムを明らかにすることが目的である．かねてより開発してきた赤外線デバイスを用いた細胞性粘菌の特性の再現は計画されているが，観測情報に基づく自己組織化を実現する行動選択は明らかでなかった．この行動選択について独自の行動ルールを作り込んでしまえば，明らかにするはずであった集団の自律性についてのメカニズムに研究者の先入観が紛れ込んでしまう恐れがある．したがって，本研究ではこの行動ルールに機械学習を用いることを考え，本年度は本研究に適した機械学習の学習モデルを模索する研究活動に取り組んだ．本研究課題では細胞性粘菌の行動を模倣するシステムを開発するため，まずは模倣学習についての知見を収集する必要があった．また，都合よく本研究課題とは別に模倣学習を用いたロボットの動作生成の研究プロジェクトに参加していたため，そこでの研究活動と合わせて自己組織ロボットに活用する手段を模索した．これらの研究活動では，ロボットの応答値から指令値を予測する学習モデルの研究開発に従事したが，開発する学習モデルを自己組織ロボットへ転用することを考慮し，制御対象のロボットの時系列データと制御対象外の独立して行動する対象物の時系列の観測データを組み合わせた学習モデルを実現するべく研究活動に取り組んだ．これは，自己組織化において，制御対象である個々の自律分散型ロボットは，周囲に存在する他ロボットの観測データに基づいて自身の行動を選択しなければならない状況への転用を想定した学習モデルである．この学習に則した目標タスクとして，本年度は画像から得られた座標情報からロボット動作の行動選択を行うタスクを設定し，これら学習モデルの基本形を完成させる研究成果が得られた．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由前述の通り，本年度では研究課題である自律分散型ロボットの行動選択に深層学習を取り入れる手法を模索した．従来の模倣学習のモデルに制御対象の時系列データと制御対象外の時系列データを同時に与えただけでは，簡単な問題を設定しない限りその関係性を理解する負担が大きく，正確な予測が困難であることが事前実験の研究活動から明らかとなった．この問題に対し，本研究は階層型学習モデルを用いた．この階層型学習モデルは上位モデルと下位モデルの二つの学習モデルを用いて学習する手法である．こうすることで制御対象内外の関係性を理解する負担を，二つのモデルに分担することが可能となることが研究活動から明らかとなった．しかし，この階層モデルに欠点が存在することが同時に明らかとされた．それは，階層型学習モデルから負担を軽減させても制御対象内外の関係性を理解することは難しいという問題が生じた．この問題を解決するべく，Attention機構を組み込んだF-L attention modelや，さらに学習の負担を下げるべく直近の動作の差分のみを予測するF-L difference modelなど様々なモデルを実装して検証を進めたが，根本的な解決手法とはならなかった．最終的に，予測する制御対象の動作のLOSSをセンサが得られる制御外の時系列データの表現に合わせる学習手法を検証し，これまでの学習結果で最も良い予測結果が得られた．その結果，ベルトコンベア上を流れる物体のピックアンドプレイスにおいて，コンベア上の把持対象の位置に合わせてロボットアームが把持位置を切り替え，把持対象がアームロボットの下に流れついたタイミングに合わせて把持動作の行動を選択するタスクを達成させた．現在は，これらの研究成果を関連研究の学習と比較できるように整理した上で実験データの再収集に取り組んでおり，論文誌への投稿する準備を進めている．
今後の研究の推進方策	今後は大きく三つに分けての研究活動に取り組む方針である．一つ目は，赤外線センシング装置の改良である．研究代表者は，本研究が課題とする自己組織化を実現する上で，核となる技術である赤外線センシング装置を用いた通信システムを開発してきた．しかし，この赤外線センシング装置は，まだ実現する自己組織ロボットの役割からして，必要以上に大きな構造を持つ装置である．また，このセンシングの精度も二次元平面上では距離と方向を計測できるが，計測装置が傾くと精度が大きく低下する問題も存在する．したがって，本年度は，この赤外線センシング装置のさらなる小型化と計測精度向上に取り組む計画である．二つ目は，全周方向から連結が可能な自己組織ロボットの開発である．本研究課題において細胞性粘菌の性質を再現することが目的にある．すなわち，どの方向からも自由に集合／分離が可能な細胞性粘菌の特性を備えた自己組織ロボットが求められる．また，赤外線センシング装置が全周方向に対してシームレスな通信／計測が可能である利点を活用する上でも重要である．現在の進捗としては，オムニホイールによる全方向移動ロボットの本体および制御回路は用意できている．したがって，今後は全周方向から容易に連結が可能な機構を台車に搭載する作業を進める．三つ目としては，自律分散制御に基づく自己組織化の制御である．この制御には機械学習を取り入れる計画である．理想としては再現対象の細胞性粘菌の行動を記録し，その情報を教師データとして用いて学習を進めることである．しかし，残された研究期間から実測した教師データの収集作業に取り組むことは難しい．したがって，本年度から得られた研究成果に基づいて，疑似的な教師データおよび環境設定から入力する制御対象のロボットと制御対象外のロボットの記録データを近い表現形式に変換した後に，機械学習から行動を獲得する手法を模索する．
次年度使用額が生じた理由	本年度は本研究課題に取り入れる機械学習のモデルを模索する研究活動に取り組んだが，まずは機械学習についての知見を実際の研究活動の試行錯誤から収集する必要があった．しかし，今年度は世界的な半導体不足や物価の上昇などが重なり，機械学習に必要な計算機器が高騰したため，十分な研究環境を配分された研究費で賄うことが困難であった．したがって，本研究課題とは別に参加している研究プロジェクトの研究課題と両立できる課題設定とした研究活動に取り組むことで，機械学習の研究活動に必要な経費を抑えることに成功した．その他の論文投稿費や文献調査の経費について同様である．以上が次年度使用額が生じた理由である．これら経費は自己組織ロボットの製作費，赤外線センシング装置の製作費，機械学習用PCの調達に使用する計画である．本年度の成果から，自律分散型自己組織ロボットの制御に必要な情報の内容と，機械学習の実装方針も定まった．したがって，次年度は自作した自己組織ロボットの実機に学習済みモデルを実装し，期待した自己組織化が実現できるかの検証を進める．また，次年度では所属していた筑波大学を離れて，八戸高等専門学校の助教として着任するため，機械学習の研究活動に必要な計算機器を新たに用意する必要がある．したがって，これらの活動に経費を利用する．

研究成果
(4件)

すべて 2023 2022

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (3件) (うち国際学会 1件)

[雑誌論文] Autoregressive Model Considering Low Frequency Errors in Command for Bilateral Control-Based Imitation Learning2023
- 著者名/発表者名
  Akagawa Tetsuro、Sakaino Sho
- 雑誌名
  
  IEEJ Journal of Industry Applications
  
  巻: 12 ページ: 26～32
- DOI
  10.1541/ieejjia.22002155
- 査読あり / オープンアクセス
[学会発表] A Learning Model Including Action Selection in Dynamic Grasping2023
- 著者名/発表者名
  Akagawa Tetsuro
- 学会等名
  Sensing, Actuation, Motion Control, and Optimization (SAMCON2023)
- 国際学会
[学会発表] バイラテラル制御に基づく模倣学習による斜面の拭き動作2022
- 著者名/発表者名
  赤川徹朗
- 学会等名
  第40回日本ロボット学会学術講演会（RSJ2022）
[学会発表] 画像認識とバイラテラル制御に基づくコンベアピッキングタスクの模倣学習2022
- 著者名/発表者名
  赤川徹朗
- 学会等名
  ロボティクス・メカトロニクス講演会2022 (ROBOMECH2022)

2022 年度 実施状況報告書

生物の集団意思決定を模倣する自律分散自己組織ロボットの集合／変形メカニズムの実現

研究代表者

赤川 徹朗 筑波大学, システム情報系, 研究員 (80910728)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Autoregressive Model Considering Low Frequency Errors in Command for Bilateral Control-Based Imitation Learning2023

著者名/発表者名

雑誌名

DOI

[学会発表] A Learning Model Including Action Selection in Dynamic Grasping2023

著者名/発表者名

学会等名

[学会発表] バイラテラル制御に基づく模倣学習による斜面の拭き動作2022

著者名/発表者名

学会等名

[学会発表] 画像認識とバイラテラル制御に基づくコンベアピッキングタスクの模倣学習2022

著者名/発表者名

学会等名

2022 年度実施状況報告書

赤川徹朗筑波大学, システム情報系, 研究員 (80910728)