2021 年度実施状況報告書

実環境における深層強化学習の実現と群ロボットへの展開

研究課題

研究課題/領域番号	19K12147
研究機関	松江工業高等専門学校
研究代表者	堀内匡松江工業高等専門学校, 電子制御工学科, 教授 (50294129)
研究分担者	青代敏行東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (40571849)
研究期間 (年度)	2019-04-01 – 2023-03-31
キーワード	深層強化学習 / 知能ロボティクス / 群ロボット / 行動獲得
研究実績の概要	本研究では，実環境での深層強化学習の実現と群ロボットの協調行動の獲得を目指す．実環境での深層強化学習を実現するために「シミュレーションと実機の差異の低減手法」を導入する．まず，本研究の第一目的として「複雑な実環境での単一のロボットの行動獲得」を実現する．家具などが存在する室内環境を模した環境において，単一の移動ロボットの視覚情報に基づく行動獲得を深層強化学習により実現する．次に，複数のロボットが存在する環境を想定し，「実機の群ロボットを対象とした協調行動の獲得」を本研究の第二目的とする．実機の群ロボットの環境における「追い抜き行動」や「すれ違い行動」などの協調行動の獲得を深層強化学習により実現する．さらに，本研究の第三目的として「深層強化学習における行動選択の説明性の向上」を実現する．深層強化学習において，ロボットがカメラ画像内のどの領域に注目して行動を選択したかを明らかにする．本年度は，本研究の第二目的である「実機の群ロボットを対象とした協調行動の獲得」および第三目的である「深層強化学習における行動選択の説明性の向上」に重点を置いて，研究を進めた．3台の移動ロボットが存在する群ロボット環境において，「追い抜き行動」の獲得および「追従行動」の獲得，「譲り合い行動」の獲得の各タスクについて，Soft Actor-Criticを用いた実現方法を検討し，シミュレーション環境および実機環境において，有効性の検証を行った．また，群ロボットの環境において，深層学習の注視領域の可視化手法であるGrad-CAMおよびGrad-CAM++を適用し，ロボットがカメラ画像内のどの領域に注目して行動を選択したかを検証した．しかし，新型コロナウィルス感染症の影響があり，シミュレーション実験に比べて，実機実験をあまり多く実施できなかった．そのため，研究期間を一年間延長し，令和4年度までとした．
現在までの達成度 (区分)	現在までの達成度 (区分) 3: やや遅れている理由本年度は，新型コロナウィルス感染症の影響があり，実機ロボットの環境での実験をあまり実施することができなかったが，シミュレーション環境での実験に重点を置いて研究を進める工夫をした．その結果，本研究における第二目的の「実機の群ロボットを対象とした協調行動の獲得」および第三目的の「深層強化学習における行動選択の説明性の向上」の両方に関して，研究を進め，一定の成果を上げることができた．これらの研究成果については，電気学会C部門大会，日本知能情報ファジィ学会中国・四国支部大会などのオンライン開催の学会において，成果発表を行った．しかし，シミュレーション環境での実験に比べて，実機環境での実験をあまり多く実施できなかった．そのため，研究期間を一年間延長し，令和4年度までとした．今後，実機環境での実験をよりスムーズに実施できるようにする予定である．以上の理由により，現在までの進捗状況は「やや遅れている」と評価する．
今後の研究の推進方策	今後はまず，実機ロボットの環境での実験をよりスムーズに実施できるように，汎用ロボットソフトウェアであるROS（Robot Operating System）を搭載した市販の実機ロボットを4台程度購入し，深層強化学習の手法として，DQN (Deep Q-network) に加えて，RainbowやSoft Actor-Criticなどの手法をROSで実装し，実機実験を行う．ROSの利用により，シミュレーション実験と同様の方法で，従来よりも簡単に実機実験を実施できると考えている．また，本研究の第三目的である「深層強化学習における行動選択の説明性の向上」に関して，引き続き検討を進める．具体的には，深層強化学習のアルゴリズムとして，RainbowやSoft Actor-Criticを導入した場合におけるロボットの注視領域を可視化する手法を検討するとともに，可視化手法の有効性を定量的に評価する方法について検討を進める．
次年度使用額が生じた理由	新型コロナウィルス感染症の影響により，発表を予定していた学会がすべてオンライン開催になり，旅費の全額が不要となった．また，新型コロナウィルス感染症の影響で，シミュレーション環境での実験に重点を置いたため，実機ロボットの環境での実験をあまり実施することができなかった．そのため，物品の購入も前年度未使用額を含めた想定よりも少なかった．これらの旅費および物品費は，次年度における旅費および物品費に使用する予定である．特に，実機実験をシミュレーション実験と同様の手順で容易に実施できるように，ROSを搭載した市販の車輪型移動ロボットを4台程度購入することを計画している．

研究成果

(6件)

すべて 2022 2021

すべて雑誌論文 (1件) (うち査読あり 1件、オープンアクセス 1件) 学会発表 (5件) (うち国際学会 1件)

[雑誌論文] モーションセンサを用いたオールの動きを可視化する試み～ローイング運動時のブレードワークに着目して～2021
- 著者名/発表者名
  一箭フェルナンドヒロシ，堀内匡
- 雑誌名
  
  スポーツパフォーマンス研究
  
  巻: 13 ページ: 418-427
- 査読あり / オープンアクセス
[学会発表] 深層強化学習を用いた群ロボットの協調行動の獲得2022
- 著者名/発表者名
  福島英，綿貫零真，堀内匡
- 学会等名
  第26回日本知能情報ファジィ学会中国・四国支部大会
[学会発表] IMUセンサを用いた漕艇動作可視化システムに関する研究2022
- 著者名/発表者名
  石原悠登，石川晃太朗，一箭フェルナンドヒロシ，堀内匡
- 学会等名
  第26回日本知能情報ファジィ学会中国・四国支部大会
[学会発表] 深層強化学習を用いた群ロボットの行動獲得に関する実験的考察2021
- 著者名/発表者名
  福島英，綿貫零真，堀内匡
- 学会等名
  2021年電気学会電子・情報・システム部門大会
[学会発表] ボート競技における漕艇動作可視化システムの基礎的検討2021
- 著者名/発表者名
  石原悠登，石川晃太朗，一箭フェルナンドヒロシ，堀内匡
- 学会等名
  2021年電気学会電子・情報・システム部門大会
[学会発表] A PBL-Oriented English Class to Foster Globally Competent Future Engineers2021
- 著者名/発表者名
  S. Matsuda, T. Horiuchi, M. Higa, A. Ashraful and J. Salsgiver
- 学会等名
  The 14th International Symposium on Advances in Technology Education
- 国際学会

2021 年度 実施状況報告書

実環境における深層強化学習の実現と群ロボットへの展開

研究代表者

堀内 匡 松江工業高等専門学校, 電子制御工学科, 教授 (50294129)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] モーションセンサを用いたオールの動きを可視化する試み～ローイング運動時のブレードワークに着目して～2021

著者名/発表者名

雑誌名

[学会発表] 深層強化学習を用いた群ロボットの協調行動の獲得2022

著者名/発表者名

学会等名

[学会発表] IMUセンサを用いた漕艇動作可視化システムに関する研究2022

著者名/発表者名

学会等名

[学会発表] 深層強化学習を用いた群ロボットの行動獲得に関する実験的考察2021

著者名/発表者名

学会等名

[学会発表] ボート競技における漕艇動作可視化システムの基礎的検討2021

著者名/発表者名

学会等名

[学会発表] A PBL-Oriented English Class to Foster Globally Competent Future Engineers2021

著者名/発表者名

学会等名

2021 年度実施状況報告書

堀内匡松江工業高等専門学校, 電子制御工学科, 教授 (50294129)