研究課題/領域番号 |
19K12147
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分61040:ソフトコンピューティング関連
|
研究機関 | 松江工業高等専門学校 |
研究代表者 |
堀内 匡 松江工業高等専門学校, 電子制御工学科, 教授 (50294129)
|
研究分担者 |
青代 敏行 東京都立産業技術高等専門学校, ものづくり工学科, 准教授 (40571849)
|
研究期間 (年度) |
2019-04-01 – 2024-03-31
|
研究課題ステータス |
完了 (2023年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2021年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円)
2020年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2019年度: 1,820千円 (直接経費: 1,400千円、間接経費: 420千円)
|
キーワード | 深層強化学習 / 知能ロボティクス / 群ロボット / 行動獲得 |
研究開始時の研究の概要 |
本研究では,実環境での深層強化学習の実現と群ロボットの協調行動の獲得を目指す.実環境での深層強化学習を実現するために,「シミュレーションと実機の差異の低減手法」を導入する.その差異の低減手法として,実機ロボットに搭載したカメラの画像に対してセグメンテーション(領域分割)と低解像度化をすることで,実環境での見え方をシミュレーション環境での見え方に近づけて,実環境の複雑さを低減する.そのうえで,複数のロボットが存在する環境を想定し,群ロボットの協調行動の獲得を実現する.さらに,実社会での応用において重要となる「深層強化学習における行動選択の説明性の向上」を実現する.
|
研究成果の概要 |
本研究では,実環境での深層強化学習を実現し,群ロボットの協調行動の獲得に応用した.まず,シミュレーションと実機の差異の低減手法を検討し,単一の移動ロボットの視覚情報に基づく行動獲得を深層強化学習により実現した.次に,複数のロボットが存在する環境を想定し,実機の群ロボットを対象とした協調行動の獲得を実現した.具体的には,群ロボットの環境における協調行動として,追従行動および追い抜き行動の獲得を深層強化学習により実現した.さらに,深層強化学習を用いたロボットの行動選択の説明性の向上に向けて,ロボットがカメラ画像内のどの領域に注目して行動を選択したかという注視領域の可視化について,有効性を確認した.
|
研究成果の学術的意義や社会的意義 |
本研究は,人工知能の中核である機械学習の技術を実機ロボットに応用したものである.深層学習と強化学習を組み合わせた深層強化学習という手法を用いて,実機ロボットが視覚情報に基づいて行動を自分自身で学習することを実現した.また,複数のロボットが存在する環境を想定し,実機の群ロボットを対象とした協調行動の獲得を実現した.具体的には,群ロボットの環境において,追従行動および追い抜き行動の獲得を実現し,深層強化学習による協調行動の学習が可能であることを明らかにした.これらの成果は,物流倉庫や福祉施設などにおける搬送ロボット群の行動制御などにつながると期待できる.
|