• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2012 年度 実施状況報告書

確率的模倣学習に基づく動作の言語化

研究課題

研究課題/領域番号 24700188
研究種目

若手研究(B)

研究機関独立行政法人情報通信研究機構

研究代表者

杉浦 孔明  独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所 情報利活用基盤研究室, 研究員 (60470473)

研究期間 (年度) 2012-04-01 – 2015-03-31
キーワード知能ロボティクス / 模倣学習 / 機械学習 / 動作認識 / ヒューマンロボットインタラクション / 軌道生成
研究概要

本研究は、刻一刻と変わる環境や状況に対応可能かつ人間らしい自然な動作を再現できる模倣学習手法を開発することを目的とする。今年度は、(1)模倣学習の実験プラットフォームとして用いるロボットのコントローラおよびシミュレータソフトウェアの開発と、(2)ペナルティ項つき尤度最大化を導入したRPD(Reference-Point-Dependent)-HMMによる模倣学習手法の開発を行った。(1)では、上半身ヒューマノイドをスライダにより昇降可能な、全方位移動台車型ヒューマノイドのコントローラを整備し、汎用的なミドルウェアから制御可能にした。(2)では、これまでに開発したRPD-HMMを拡張し、学習サンプルが少ない場合にも不安定な軌道を生成しないように改良した。HMMを用いた単純なサンプリングに基づく動作生成と比較して、RPD-HMMによる動作生成は尤度最大化という見通しのよい基盤を持ち、高速な生成が可能であるというメリットがある。しかし、模倣学習分野では学習サンプルを収集するコストが音声合成などの分野と比較して大きいため、パラメータ数の増加は大きなデメリットである。そこで、RPD-HMMに軌道の滑らかさを制御するマクロパラメータを導入し、マクロパラメータをペナルティ項とする尤度最大化により軌道を生成する手法を提案した。これにより、パラメータ数を削減しつつ滑らかな軌道生成を可能にした。性能評価実験のため、マクロパラメータを使用しないベースライン手法との比較評価を行った。その結果、正解(位置・速度・加速度を用いたHMM軌道生成)からの二乗誤差に関して、提案手法がベースライン手法より優れるという結果を得た。

現在までの達成度 (区分)
現在までの達成度 (区分)

3: やや遅れている

理由

今年度は、マクロパラメータをペナルティ項とする尤度最大化により軌道を生成する手法を提案した。性能評価実験のため、マクロパラメータを使用しないベースライン手法との比較評価を行った結果、正提案手法がベースライン手法より優れるという結果を得ている。
一方、本研究の目的である、刻一刻と変わる環境や状況に対応可能かつ人間らしい自然な動作を再現できる模倣学習手法を実現するためには、模倣学習のオンライン化が不可欠である。本研究課題ではこれをH25年度に達成すべき最優先課題とする。これまで予備的検討として、Rapidly-exploring Random Trees(RRT)とRPD-HMMを組み合わせた手法を開発しているが自然性において問題がある。H25年度には、この手法の改良と、解析的に最尤軌道を求める手法の開発を行い、2つの手法を比較評価する。定量的評価指標として、人間が実行した軌道との二乗誤差を用いる。

今後の研究の推進方策

平成25年度は、(1)RPD(Reference-Point-Dependent)-HMMによるオンライン模倣の確立と、(2)全身動作へのRPD-HMMの適用に取り組む。(1)では、これまで開発したRPD-HMMをオンライン化し、時々刻々と変わる環境における軌道生成手法を開発する。(2)では、CGへの応用を念頭におき、テニスやキャッチボールなどの全身動作の合成法を開発する。球技の主要動作は、ボールを参照点とした動作であるため、RPD-HMMが適用可能であると考える。軌道生成時には、障害物回避や足と床の間の力学的バランスを拘束条件としてRPD-HMMによる、即応的軌道生成手法を開発する。客観評価では正解軌道との二乗誤差を基準とする。主観評価では、CG上で生成軌道を被験者に提示し、自然さなどをアンケート評価する。最終年度に家庭用ロボットによる模倣統合システムとして成果を統合する準備として、開発した手法の台車型ヒューマノイドへの実装に着手する。

次年度の研究費の使用計画

平成24年度に実験準備のためのハードウェア設計のために支援作業者へ謝金を支払った。この作業において支援作業者が新たに開発したCADモデルを使用できたため、想定より作業が早く終了し当該助成金(B-A)が生じた。平成25年度は、データアノテーションなどの支援作業のための費用を計上しているので、当該助成金を追加してデータ量を増加させ開発手法の精度を向上させる。

  • 研究成果

    (3件)

すべて 2012

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件)

  • [雑誌論文] ロボット対話 -実世界情報を用いたコミュニケーションの学習-2012

    • 著者名/発表者名
      杉浦孔明
    • 雑誌名

      人工知能学会誌

      巻: 27 ページ: 580-586

    • 査読あり
  • [学会発表] 物体操作タスクのためのペナルティ項付き尤度最大化によるHMM軌道生成2012

    • 著者名/発表者名
      杉浦孔明, 岩橋直人, 柏岡秀紀
    • 学会等名
      第13回計測自動制御学会システムインテグレーション部門講演会
    • 発表場所
      福岡国際会議場(福岡県)
    • 年月日
      20121218-20121220
  • [学会発表] 物体操作タスクにおけるマクロパラメータを用いたHMM軌道生成2012

    • 著者名/発表者名
      杉浦孔明, 岩橋直人, 柏岡秀紀
    • 学会等名
      第30回日本ロボット学会学術講演会
    • 発表場所
      札幌コンベンションセンター(北海道)
    • 年月日
      20120917-20120920

URL: 

公開日: 2014-07-24  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi