群ロボットの作業計画問題における行動学習

研究課題

研究課題/領域番号	08233203
研究種目	重点領域研究
配分区分	補助金
研究機関	東京大学
研究代表者	新井民夫東京大学, 工学系研究科, 教授 (40111463)
研究分担者	相山康道東京大学, 工学系研究科, 助手 (60272374)
研究期間 (年度)	1996
研究課題ステータス	完了 (1996年度)
配分額 *注記	2,500千円 (直接経費: 2,500千円) 1996年度: 2,500千円 (直接経費: 2,500千円)
キーワード	移動ロボット / 創発システム / 強化学習 / 経路計画 / Visibility Graph
研究概要	本研究では,多数の自律的な移動ロボットが存在する系において,与えられた作業仕様を満たす各ロボットの適切な行動戦略を階層型アーキテクチャにより学習する手法を提案する.本研究では作業目的を郡ロボットの動作に限定し,問題を大きく「移動経路の決定階層」と「経路上での戦略形成階層」の2つに階層化し,それぞれの階層において学習則を付与することで問題の解決を図る.本研究は,1.制御則の提案,2.シミュレーションによる検証,3.一般系への拡張と創発に関する考察,を予定していた.本年度の成果としては,スタート地点からゴール地点へ多数の物体を複数のロボットで繰り返し搬送する作業を題材とし,1-(1).既知環境下での最適(最速)搬送経路選択学習則の提案,1-(2).未知環境下におけるLearned Visibility Graphを用いた搬送経路の生成手法の提案,2-(1).最適搬送経路学習シミュレーションおよび二台の小型ロボットを用いた簡易検証実験,2-(2).搬送経路生成シミュレーションおよび一台の小型ロボットによる簡易実験,3-(1).最適搬送経路学習に基づく創発性の検証,を行なった.1-(1).,2-(1).,3-(1).では,個々のロボットが単位時間あたりに運んだ物体個数から,いくつかの戦略から各々の選択する確率を修正する強化学習を採り入れ,これにより個々のロボット毎に学習しているにも関わらず,全体として最適な搬送形態が創発されていくことを確認した.また,2-(1).ならびに2-(2).では,障害物に遭遇し,経路が左右に分岐してしまう際に,両者にサブゴールをマークしておくことで、常に最短経路を探索しながらほぼ全ての経路候補を生成することが可能となっている.

報告書

(1件)

1996 実績報告書