2003 Fiscal Year Annual Research Report
知的インタフェースを有するマルチロボット系の高速制御方式と強化学習による群知能
Project/Area Number |
15500125
|
Research Institution | Kinki University |
Principal Investigator |
五十嵐 治一 近畿大学, 工学部, 教授 (80288886)
|
Co-Investigator(Kenkyū-buntansha) |
五百井 清 近畿大学, 工学部, 教授 (90288887)
黒瀬 能聿 近畿大学, 工学部, 教授 (00043802)
|
Keywords | 自律移動型ロボット / 強化学習 / マルチエージェント / RoboCup / 追跡問題 / 経路計画 / 行動学習 |
Research Abstract |
ロボットフィールド上方に設置したビデオカメラ(グローバルビジョン),ホストPC1台(画像処理サーバ,通信中継サーバ,リモートブレイン用プログラム),ホストPCに内蔵された画像キャプチャーボード,ロボット5台から構成されるロボットシステムを新たに構築し,基本的な走行動作が行えるまでにシステムを完成させた.ロボット本体は,ロボス社製の4輪全方向走行型ロボットをそのまま使用し,グローバルビジョン用のビデオカメラには高解像度のものを採用した.ただし,このグローバルビジョンを用いたビジュアルフィードバック制御によるロボットの姿勢制御については,本システムのロボットで採用されているオムニホイール(車輪)の滑りや転がりによる影響が大きく,完全に制御できる状況には至っていない. また,マルチエージェントシステムにおける行動学習の例として,獲物と複数ハンターとによる「追跡問題」を取り上げ,方策こう配法を用いた学習方式を提案した.他の代表的な強化学習法であるQ学習による学習方式とともに,シミュレーション実験を行って結果を比較した.この実験により,方策こう配法を用いた提案方式は,状態と行動の対の重み(Q値)以外にも,知識を学習し,かつ,利用できるという適用範囲の広さを示すことができた. さらに,Q学習法の多目的な学習問題への適用実験例として,「崖歩き問題」を取り上げ,報酬関数を各目的に対応した項の線形和で表現する方式の有効性を検討した.
|
Research Products
(2 results)
-
[Publications] H.Igarashi, 他: "Navigation of a Mobile Robot Formulated in Terms of Discrete Optimization Problems"Systems and Computers in Japan. Vol.34,No.6. 59-68 (2003)
-
[Publications] 五十嵐治一, 他: "近畿大学工学部におけるRoboCupへの取り組み"アドバンティ2004シンポジウム講演論文集. 1-3 (2004)