研究概要 |
均質な自律移動ロボット群において,高い自律性を与えて取り巻く環境との相互作用を通して各自が集団内で自分の役割を発見するとともに,他のロボットとの協調タイミングを獲得して作業チームを自己組織化することのできる自律ロボット群の新しい制御方式の構築を試みた.このための群に持たせるべき機能特徴は,自律的機能分化機構の埋め込みであった.これに対して,本研究では,強化学習と人工進化を計算基礎論として採用し,自律的機能分化機構の構築をはかった.ゆえに,(1)算法自体の能力向上,(2)それらのマルチロボットシステムへの適用,を中心に議論を展開した. 1.基礎論 強化学習(RL):学習しながら状態空間・行動空間を適応的に離散化するベイズ判別法を用いた.オンライン離散化機構を持つ学習器を提案した.実機実験も並行して行い,学習の頑健性・有効性を検証した. 進化型計算(EC):進化型計算の遺伝的浮動を利用した拡張法を提案した.数多くのテスト関数最適化において頑健性および探索性能の向上が確認するとともに,実問題でも有効性を確認した. 2.マルチロボットシステムへの適用 RLによるアプローチ:この環境は各ロボットにとって動的環境であるから,静的環境を想定して構築されたRLをそのまま適用しても効果的な行動獲得は期待できない.そのため,(1)1ステップ未来の環境の推移を予測する機構を追加する方法,(2)非利己的行動を獲得するためのRL機構を追加する方法を提案し,計算機実験を通して機能分化の創発を観測するとともに手法の有効性を確認した. ECによるアプローチ:進化人工神経回路網で表現した制御器の進化ダイナミクスを測定し,その特性を明らかにした.さらに,マルチロボットシステムに適用し,システムダイナミクスを観測した.その結果,協調的な役割分担の状況が発生した後に大域的に安定な振舞いが獲得されることを観測した.
|