1998 Fiscal Year Annual Research Report

行動確率場モデルによる複数ロボットの協調作業のための行動選択方式

Research Project

Project/Area Number	10680408
Research Institution	Kyushu Institute of Technology
Principal Investigator	江島俊朗九州工業大学, 情報工学部, 教授 (00124553)
Co-Investigator(Kenkyū-buntansha)	大橋健九州工業大学, 情報工学部, 助手 (00233239) 吉田隆一九州工業大学, 情報工学部, 助教授 (70200996)
Keywords	自律型ロボット / 強化学習 / 自己組織化 / Q-学習
Research Abstract	本研究では,より高精度の学習法として,ロボットが持つ連続系の状態をそのまま扱うことが可能な行動確率場モデルを新たに提案した.行動確率場モデルは,連続系のセンサ空間に存在する行動有用度関数を基底関数の重みつき線形和で表すことにより,学習パラメータを絞り,実時間での現実的な学習を可能とするものである. 従来の学習手法との性能を比較するために,連続センサをもつロボットで餌拾い行動を学習し,実験した.この結果,行動確率場モデルは,状態の離散化粒度,状態の位置のずれにより発生する誤差に対して頑健であることが確認できた.つまり,行動確率場モデルを用いることにより,従来の離散状態で発生していた誤差を吸収し,より高精度の学習が可能である.これは,関数近似の際,基底関数としてガウス関数を用いた場合,個数,中心座標,幅の値のずれに対して頑健であり,これらの値の自動決定の可能性を示している. このことを踏まえ,基底関数の個数,中心座標,幅の値を自律的に獲得する手法を提案した。基底関数の類似に注目し,類似するもの同士を統合することにより,最適な基底関数の個数,中心座標と幅の値を学習中に自律的に獲得する手法を考案した.基底関数の類似度を中心座標での確率分布と中心座標の二つの値であらわすとした.この二つの類似度と,基底関数の自己組織化に必要な時間を考慮して,類似する基底関数同士を統合し,新たに基底関数を生成した.このことにより,学習を行うときに,基底関数の配置をタスク毎に構成する必要がなく,タスク,ロボットパラメータに対して適切な基底関数を自律的に獲得可能となった。

Research Products

(2 results)

All Publications (2 results)

[Publications] 榎田修一,大橋,吉田,江島: "行動確率場モデルによる行動獲得手法の高性能化" 第16回日本ロボット学会学術講演会予稿集. Vol.1. 405-406 (1998)
[Publications] 福田,大橋,吉田,江島: "自律型ロボットの強化学習によるショート行動の獲得" 第51回電気関連九州支部連合大会講演会予稿集. 92 (1998)