Budget Amount *help |
¥2,500,000 (Direct Cost: ¥2,500,000)
Fiscal Year 1996: ¥2,500,000 (Direct Cost: ¥2,500,000)
|
Research Abstract |
本研究では,多数の自律的な移動ロボットが存在する系において,与えられた作業仕様を満たす各ロボットの適切な行動戦略を階層型アーキテクチャにより学習する手法を提案する.本研究では作業目的を郡ロボットの動作に限定し,問題を大きく「移動経路の決定階層」と「経路上での戦略形成階層」の2つに階層化し,それぞれの階層において学習則を付与することで問題の解決を図る.本研究は,1.制御則の提案,2.シミュレーションによる検証,3.一般系への拡張と創発に関する考察,を予定していた.本年度の成果としては,スタート地点からゴール地点へ多数の物体を複数のロボットで繰り返し搬送する作業を題材とし,1-(1).既知環境下での最適(最速)搬送経路選択学習則の提案,1-(2).未知環境下におけるLearned Visibility Graphを用いた搬送経路の生成手法の提案,2-(1).最適搬送経路学習シミュレーションおよび二台の小型ロボットを用いた簡易検証実験,2-(2).搬送経路生成シミュレーションおよび一台の小型ロボットによる簡易実験,3-(1).最適搬送経路学習に基づく創発性の検証,を行なった.1-(1).,2-(1).,3-(1).では,個々のロボットが単位時間あたりに運んだ物体個数から,いくつかの戦略から各々の選択する確率を修正する強化学習を採り入れ,これにより個々のロボット毎に学習しているにも関わらず,全体として最適な搬送形態が創発されていくことを確認した.また,2-(1).ならびに2-(2).では,障害物に遭遇し,経路が左右に分岐してしまう際に,両者にサブゴールをマークしておくことで、常に最短経路を探索しながらほぼ全ての経路候補を生成することが可能となっている.
|