研究概要 |
【1】動的関係に基づく内部ダイナミクスの形成と身体運動パターン生成 対象物との動的な関係から、身体各部の時空間運動パターンをフィードフォワード的に内部生成する必要がある.そこでは、環境変化の予測と身体ダイナミクス調節が重要な役割を果たす.ポイントは、学習初期の状態空間拘束と内部モデルによる状態予測(学習初期は誤差大)のバランスを学習の進行とともにどのように制御するかである,本年度は、人間の運動学習初期に見られる筋の同時活動(手足をかたくする等)をヒントに、身体ダイナミクス調節による関節自由度と環境ダイナミクスの拘束、およびそれに基づく内部モデルを同時に獲得する学習アルゴリズムを開発した. 【2】環境変化に適合した知能行動の獲得 高次元・連続な状態入出力を有する制御対象として移動ロボットに着目し,その感覚・行動間写像の同定に強化学習を適用する.このとき問題となる,計算資源の割当て問題を解決するための一手法として,NGnetで実装される学習器の構造パラメータ(RBF関数の中心ならびに標準偏差)を同時に局所探索する進化的recruitmement戦略を提案する.本年度は提案戦略のアルゴリズムを計算機上に実装し,一定時間ごとに関数形状が動的に変化する目的関数のオンライン関数近似課題に適用し,その有効性を確認した.また,同手法を移動ロボットの行動獲得問題に適用した.計算機シミュレータ上に,ロボットと円柱状の搬送物体(以降Pegと呼ぶ)のモデルを実装し,さまざまな初期姿勢から押し動作学習を行わせた.ロボットの感覚・行動間写像は先のNGnetで実装され,その構造パラメータは提案手法でオンライン調節された.シミュレーション結果から,提案手法は学習の伸展とともに学習器を構成する基底関数の構造パラメータが漸進的にチューニングされるため,追加する基底関数のサイズをあらかじめ設計者が指定しなければならない従来手法と比べて,より少ない数の基底関数で制御器を構成できることが確認された.さらに,上記のPeg押し課題について実ロボットを用いた検証実験を行い,一時間弱の試行の後にロボットが所望のタスクを学習できることを確認した.
|