• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Research-status Report

実環境における深層強化学習の実現と群ロボットへの展開

Research Project

Project/Area Number 19K12147
Research InstitutionMatsue National College of Technology

Principal Investigator

堀内 匡  松江工業高等専門学校, 電子制御工学科, 教授 (50294129)

Co-Investigator(Kenkyū-buntansha) 青代 敏行  東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (40571849)
Project Period (FY) 2019-04-01 – 2023-03-31
Keywords深層強化学習 / 知能ロボティクス / 群ロボット / 行動獲得
Outline of Annual Research Achievements

本研究では,実環境での深層強化学習の実現と群ロボットの協調行動の獲得を目指す.実環境での深層強化学習を実現するために「シミュレーションと実機の差異の低減手法」を導入する.まず,本研究の第一目的として「複雑な実環境での単一のロボットの行動獲得」を実現する.家具などが存在する室内環境を模した環境において,単一の移動ロボットの視覚情報に基づく行動獲得を深層強化学習により実現する.次に,複数のロボットが存在する環境を想定し,「実機の群ロボットを対象とした協調行動の獲得」を本研究の第二目的とする.実機の群ロボットの環境における「追い抜き行動」や「すれ違い行動」などの協調行動の獲得を深層強化学習により実現する.さらに,本研究の第三目的として「深層強化学習における行動選択の説明性の向上」を実現する.深層強化学習において,ロボットがカメラ画像内のどの領域に注目して行動を選択したかを明らかにする.
本年度は,本研究の第二目的である「実機の群ロボットを対象とした協調行動の獲得」および第三目的である「深層強化学習における行動選択の説明性の向上」に重点を置いて,研究を進めた.3台の移動ロボットが存在する群ロボット環境において,「追い抜き行動」の獲得および「追従行動」の獲得,「譲り合い行動」の獲得の各タスクについて,Soft Actor-Criticを用いた実現方法を検討し,シミュレーション環境および実機環境において,有効性の検証を行った.また,群ロボットの環境において,深層学習の注視領域の可視化手法であるGrad-CAMおよびGrad-CAM++を適用し,ロボットがカメラ画像内のどの領域に注目して行動を選択したかを検証した.しかし,新型コロナウィルス感染症の影響があり,シミュレーション実験に比べて,実機実験をあまり多く実施できなかった.そのため,研究期間を一年間延長し,令和4年度までとした.

Current Status of Research Progress
Current Status of Research Progress

3: Progress in research has been slightly delayed.

Reason

本年度は,新型コロナウィルス感染症の影響があり,実機ロボットの環境での実験をあまり実施することができなかったが,シミュレーション環境での実験に重点を置いて研究を進める工夫をした.その結果,本研究における第二目的の「実機の群ロボットを対象とした協調行動の獲得」および第三目的の「深層強化学習における行動選択の説明性の向上」の両方に関して,研究を進め,一定の成果を上げることができた.これらの研究成果については,電気学会C部門大会,日本知能情報ファジィ学会中国・四国支部大会などのオンライン開催の学会において,成果発表を行った.
しかし,シミュレーション環境での実験に比べて,実機環境での実験をあまり多く実施できなかった.そのため,研究期間を一年間延長し,令和4年度までとした.今後,実機環境での実験をよりスムーズに実施できるようにする予定である.以上の理由により,現在までの進捗状況は「やや遅れている」と評価する.

Strategy for Future Research Activity

今後はまず,実機ロボットの環境での実験をよりスムーズに実施できるように,汎用ロボットソフトウェアであるROS(Robot Operating System)を搭載した市販の実機ロボットを4台程度購入し,深層強化学習の手法として,DQN (Deep Q-network) に加えて,RainbowやSoft Actor-Criticなどの手法をROSで実装し,実機実験を行う.ROSの利用により,シミュレーション実験と同様の方法で,従来よりも簡単に実機実験を実施できると考えている.
また,本研究の第三目的である「深層強化学習における行動選択の説明性の向上」に関して,引き続き検討を進める.具体的には,深層強化学習のアルゴリズムとして,RainbowやSoft Actor-Criticを導入した場合におけるロボットの注視領域を可視化する手法を検討するとともに,可視化手法の有効性を定量的に評価する方法について検討を進める.

Causes of Carryover

新型コロナウィルス感染症の影響により,発表を予定していた学会がすべてオンライン開催になり,旅費の全額が不要となった.また,新型コロナウィルス感染症の影響で,シミュレーション環境での実験に重点を置いたため,実機ロボットの環境での実験をあまり実施することができなかった.そのため,物品の購入も前年度未使用額を含めた想定よりも少なかった.これらの旅費および物品費は,次年度における旅費および物品費に使用する予定である.特に,実機実験をシミュレーション実験と同様の手順で容易に実施できるように,ROSを搭載した市販の車輪型移動ロボットを4台程度購入することを計画している.

  • Research Products

    (6 results)

All 2022 2021

All Journal Article (1 results) (of which Peer Reviewed: 1 results,  Open Access: 1 results) Presentation (5 results) (of which Int'l Joint Research: 1 results)

  • [Journal Article] モーションセンサを用いたオールの動きを可視化する試み~ローイング運動時のブレードワークに着目して~2021

    • Author(s)
      一箭 フェルナンド ヒロシ,堀内 匡
    • Journal Title

      スポーツパフォーマンス研究

      Volume: 13 Pages: 418-427

    • Peer Reviewed / Open Access
  • [Presentation] 深層強化学習を用いた群ロボットの協調行動の獲得2022

    • Author(s)
      福島 英,綿貫零真,堀内 匡
    • Organizer
      第26回日本知能情報ファジィ学会中国・四国支部大会
  • [Presentation] IMUセンサを用いた漕艇動作可視化システムに関する研究2022

    • Author(s)
      石原悠登,石川晃太朗,一箭 フェルナンド ヒロシ,堀内 匡
    • Organizer
      第26回日本知能情報ファジィ学会中国・四国支部大会
  • [Presentation] 深層強化学習を用いた群ロボットの行動獲得に関する実験的考察2021

    • Author(s)
      福島 英,綿貫零真,堀内 匡
    • Organizer
      2021年電気学会電子・情報・システム部門大会
  • [Presentation] ボート競技における漕艇動作可視化システムの基礎的検討2021

    • Author(s)
      石原悠登,石川晃太朗,一箭 フェルナンド ヒロシ,堀内 匡
    • Organizer
      2021年電気学会電子・情報・システム部門大会
  • [Presentation] A PBL-Oriented English Class to Foster Globally Competent Future Engineers2021

    • Author(s)
      S. Matsuda, T. Horiuchi, M. Higa, A. Ashraful and J. Salsgiver
    • Organizer
      The 14th International Symposium on Advances in Technology Education
    • Int'l Joint Research

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi