研究課題/領域番号 |
19K12147
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
堀内 匡 松江工業高等専門学校, 電子制御工学科, 教授 (50294129)
|
研究分担者 |
青代 敏行 東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (40571849)
|
研究期間 (年度) |
2019-04-01 – 2023-03-31
|
キーワード | 深層強化学習 / 知能ロボティクス / 群ロボット / 行動獲得 |
研究実績の概要 |
本研究では,実環境での深層強化学習の実現と群ロボットの協調行動の獲得を目指す.実環境での深層強化学習を実現するために「シミュレーションと実機の差異の低減手法」を導入する.まず,本研究の第一目的として「複雑な実環境での単一のロボットの行動獲得」を実現する.家具などが存在する室内環境を模した環境において,単一の移動ロボットの視覚情報に基づく行動獲得を深層強化学習により実現する.次に,複数のロボットが存在する環境を想定し,「実機の群ロボットを対象とした協調行動の獲得」を本研究の第二目的とする.実機の群ロボットの環境における「追い抜き行動」や「すれ違い行動」などの協調行動の獲得を深層強化学習により実現する.さらに,本研究の第三目的として「深層強化学習における行動選択の説明性の向上」を実現する.深層強化学習において,ロボットがカメラ画像内のどの領域に注目して行動を選択したかを明らかにする. 本年度は,本研究の第二目的である「実機の群ロボットを対象とした協調行動の獲得」および第三目的である「深層強化学習における行動選択の説明性の向上」に重点を置いて,研究を進めた.3台の移動ロボットが存在する群ロボット環境において,「追い抜き行動」の獲得および「追従行動」の獲得,「譲り合い行動」の獲得の各タスクについて,Soft Actor-Criticを用いた実現方法を検討し,シミュレーション環境および実機環境において,有効性の検証を行った.また,群ロボットの環境において,深層学習の注視領域の可視化手法であるGrad-CAMおよびGrad-CAM++を適用し,ロボットがカメラ画像内のどの領域に注目して行動を選択したかを検証した.しかし,新型コロナウィルス感染症の影響があり,シミュレーション実験に比べて,実機実験をあまり多く実施できなかった.そのため,研究期間を一年間延長し,令和4年度までとした.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
本年度は,新型コロナウィルス感染症の影響があり,実機ロボットの環境での実験をあまり実施することができなかったが,シミュレーション環境での実験に重点を置いて研究を進める工夫をした.その結果,本研究における第二目的の「実機の群ロボットを対象とした協調行動の獲得」および第三目的の「深層強化学習における行動選択の説明性の向上」の両方に関して,研究を進め,一定の成果を上げることができた.これらの研究成果については,電気学会C部門大会,日本知能情報ファジィ学会中国・四国支部大会などのオンライン開催の学会において,成果発表を行った. しかし,シミュレーション環境での実験に比べて,実機環境での実験をあまり多く実施できなかった.そのため,研究期間を一年間延長し,令和4年度までとした.今後,実機環境での実験をよりスムーズに実施できるようにする予定である.以上の理由により,現在までの進捗状況は「やや遅れている」と評価する.
|
今後の研究の推進方策 |
今後はまず,実機ロボットの環境での実験をよりスムーズに実施できるように,汎用ロボットソフトウェアであるROS(Robot Operating System)を搭載した市販の実機ロボットを4台程度購入し,深層強化学習の手法として,DQN (Deep Q-network) に加えて,RainbowやSoft Actor-Criticなどの手法をROSで実装し,実機実験を行う.ROSの利用により,シミュレーション実験と同様の方法で,従来よりも簡単に実機実験を実施できると考えている. また,本研究の第三目的である「深層強化学習における行動選択の説明性の向上」に関して,引き続き検討を進める.具体的には,深層強化学習のアルゴリズムとして,RainbowやSoft Actor-Criticを導入した場合におけるロボットの注視領域を可視化する手法を検討するとともに,可視化手法の有効性を定量的に評価する方法について検討を進める.
|
次年度使用額が生じた理由 |
新型コロナウィルス感染症の影響により,発表を予定していた学会がすべてオンライン開催になり,旅費の全額が不要となった.また,新型コロナウィルス感染症の影響で,シミュレーション環境での実験に重点を置いたため,実機ロボットの環境での実験をあまり実施することができなかった.そのため,物品の購入も前年度未使用額を含めた想定よりも少なかった.これらの旅費および物品費は,次年度における旅費および物品費に使用する予定である.特に,実機実験をシミュレーション実験と同様の手順で容易に実施できるように,ROSを搭載した市販の車輪型移動ロボットを4台程度購入することを計画している.
|