• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

多様なロボット行動生成のための自律分散原理を用いた特徴抽出空間の構成

研究課題

研究課題/領域番号 17700218
研究機関東京農工大学

研究代表者

小林 祐一  東京農工大学, 大学院共生科学技術研究院, 特任助教授 (60373304)

キーワード関数近似 / 拘束運動 / 強化学習
研究概要

ロボットの行動学習の方法の一つである強化学習の学習効率を改善するアプローチとして,状態遷移関数のモデル化や,ロボットの実際の運動が拘束される低次元空間を同定し探索空間を低次元化することが考えられる.特に,ロボットが環境や対象物と接触するタスクでは,接触により生じる拘束を積極的に利用することで状態空間を低次元化し,学習の効率を高めることが期待できる.本研究では,ロボットと対象との間の接触による拘束多様体を推定する関数近似を行う自律分散原理に基づいた方法を提案した.
提案手法は,局所的な2次形式を用いた局所近似モデルと,局所近似モデル間の補間を行う補間モデルからなる.補間モデルには曲率などで定義される仮想エネルギーを最小化するアプローチを採用し,近似対象曲面の連続性を利用して局所形状の補間および補外を可能にした.本提案関数近似手法の適用対象として,2自由度マニピュレータによる円形対象物の操作問題をシミュレーション上で実装した.対象物とロボット手先が接触することで対象物および手先の運動が拘束により制約を受ける拘束曲面の推定問題を考え,手先と対象物の接触により得られた観測データ(サンプル)から提案関数近似法によって曲面の推定を行う.オンラインで与えられるサンプルに対し,逐次的に曲面の推定を行い,少ないサンプルからでも局所形状の補間によって効率よく推定が行えることを確認した.本提案手法は,曲面の推定方法を与えると同時に,高次元空間から低次元部分多様体へのパラメータ化行うことのできる手法である.これにより,効率のよい近似だけでなく学習を行うための低次元空間を与える写像法としての役割を果たし,強化学習の枠組みの中で有用になる可能性を持っている.

  • 研究成果

    (2件)

すべて 2006

すべて 雑誌論文 (2件)

  • [雑誌論文] 局所形状情報の補間を利用した行動学習のための関数近似2006

    • 著者名/発表者名
      小林祐一, 細江繁幸
    • 雑誌名

      第9回情報論的学習理論ワークショップ予稿集

      ページ: 178-183

  • [雑誌論文] 局所形状情報の1次元的補間に基づく拘束付強化学習問題のための関数近似2006

    • 著者名/発表者名
      小林祐一, 細江繁幸
    • 雑誌名

      計測自動制御学会 第33回 知能システムシンポジウム資料

      ページ: 19-24

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi