Research Abstract |
本研究では,より高精度の学習法として,ロボットが持つ連続系の状態をそのまま扱うことが可能な行動確率場モデルを新たに提案した.行動確率場モデルは,連続系のセンサ空間に存在する行動有用度関数を基底関数の重みつき線形和で表すことにより,学習パラメータを絞り,実時間での現実的な学習を可能とするものである. 従来の学習手法との性能を比較するために,連続センサをもつロボットで餌拾い行動を学習し,実験した.この結果,行動確率場モデルは,状態の離散化粒度,状態の位置のずれにより発生する誤差に対して頑健であることが確認できた.つまり,行動確率場モデルを用いることにより,従来の離散状態で発生していた誤差を吸収し,より高精度の学習が可能である.これは,関数近似の際,基底関数としてガウス関数を用いた場合,個数,中心座標,幅の値のずれに対して頑健であり,これらの値の自動決定の可能性を示している. このことを踏まえ,基底関数の個数,中心座標,幅の値を自律的に獲得する手法を提案した。基底関数の類似に注目し,類似するもの同士を統合することにより,最適な基底関数の個数,中心座標と幅の値を学習中に自律的に獲得する手法を考案した.基底関数の類似度を中心座標での確率分布と中心座標の二つの値であらわすとした.この二つの類似度と,基底関数の自己組織化に必要な時間を考慮して,類似する基底関数同士を統合し,新たに基底関数を生成した.このことにより,学習を行うときに,基底関数の配置をタスク毎に構成する必要がなく,タスク,ロボットパラメータに対して適切な基底関数を自律的に獲得可能となった。
|