研究概要 |
ロボットフィールド上方に設置したビデオカメラ(グローバルビジョン),ホストPC1台(画像処理サーバ,通信中継サーバ,リモートブレイン用プログラム),ホストPCに内蔵された画像キャプチャーボード,ロボット5台から構成されるロボットシステムを新たに構築し,基本的な走行動作が行えるまでにシステムを完成させた.ロボット本体は,ロボス社製の4輪全方向走行型ロボットをそのまま使用し,グローバルビジョン用のビデオカメラには高解像度のものを採用した.ただし,このグローバルビジョンを用いたビジュアルフィードバック制御によるロボットの姿勢制御については,本システムのロボットで採用されているオムニホイール(車輪)の滑りや転がりによる影響が大きく,完全に制御できる状況には至っていない. また,マルチエージェントシステムにおける行動学習の例として,獲物と複数ハンターとによる「追跡問題」を取り上げ,方策こう配法を用いた学習方式を提案した.他の代表的な強化学習法であるQ学習による学習方式とともに,シミュレーション実験を行って結果を比較した.この実験により,方策こう配法を用いた提案方式は,状態と行動の対の重み(Q値)以外にも,知識を学習し,かつ,利用できるという適用範囲の広さを示すことができた. さらに,Q学習法の多目的な学習問題への適用実験例として,「崖歩き問題」を取り上げ,報酬関数を各目的に対応した項の線形和で表現する方式の有効性を検討した.
|