2013 年度実施状況報告書

確率的模倣学習に基づく動作の言語化

研究課題

研究課題/領域番号	24700188
研究機関	独立行政法人情報通信研究機構
研究代表者	杉浦孔明独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所情報利活用基盤研究室, 主任研究員 (60470473)
キーワード	知能ロボティクス / 模倣学習 / 機械学習 / 動作認識
研究概要	本研究は，刻一刻と変わる環境や状況に対応可能かつ人間らしい自然な動作を再現できる模倣学習手法を開発することを目的とする．今年度は，逐次的な動作生成が可能な模倣学習手法（オンライン模倣）の構築を行った．「XをYにのせる」「Zを回す」などの物体操作の模倣学習手法では，操作軌道を２つのオブジェクト間の相対軌道として表現し，確率モデルを用いて軌道を学習させるものが多い．模倣学習の分野では，隠れマルコフモデル（HMM）を用いて軌道を逐次的に生成する手法（例えば，[Calinonら, IEEE Robotics & Automation Magazine, 2010]）が提案されているが，この手法では最尤軌道が得られる保証がない．一方，我々が前年度までに提案した，参照点に依存した隠れマルコフモデル（RPD-HMM; Reference-Point-Dependent HMM）では，最尤軌道の生成は可能であるが逐次的な生成ができないという問題があった．そこで今年度は，RPD-HMMから生成された最尤軌道を基準とした逐次動作生成手法を開発した．これにより，人工的な外力を導入して逐次的に障害物を回避することが可能になる．実験では，非逐次型のベースライン手法との比較評価を行った．その結果，外力を加えた場合であっても，提案手法は滑らかな軌道を生成できるという結果を得た．また，人間が実行した軌道からの生成誤差についても，実用上十分小さいことを確認した．
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由本研究課題でのH25年度に達成すべき最優先課題は，模倣学習手法における逐次型動作生成（オンライン模倣）であった．この課題を達成するため，RPD-HMMに基づく逐次型動作生成手法の開発に取り組み，（外力が存在しない場合に）最尤軌道を生成するというRPD-HMMの特徴と，逐次的に動作生成が可能という２つの特徴を有する模倣学習手法を開発できた．
今後の研究の推進方策	H26年度は，（１）逐次型RPD-HMMの改良および上半身動作への適用と，（２）模倣統合システムのサービスロボットへの展開，に取り組む．まず（１）では，これまでに開発したサンプリングベースで軌道を生成する手法と逐次型RPD-HMMの比較を行い，改良および統合を検討する．家事動作などのうち上半身動作に着目してオンライン模倣学習手法を適用する．人間が実行した軌道との二乗誤差を定量的評価指標とする．主観評価では，CG上で生成軌道を被験者に提示し，自然さなどをアンケート評価する．（２）では，オンライン模倣学習手法を台車型ヒューマノイドに実装し，リビングルームを模擬した環境における評価実験を行う．タスク環境として，ロボカップ＠ホーム環境を参考にする．客観評価指標として正解軌道との二乗誤差を用いる．

研究成果
(3件)

すべて 2013 その他

すべて雑誌論文 (1件) 学会発表 (2件) (うち招待講演 1件)

[雑誌論文] ロボカップ＠ホームにおける日用品マニピュレーション2013
- 著者名/発表者名
  杉浦孔明, 長井隆行
- 雑誌名
  
  日本ロボット学会誌
  
  巻: 31 ページ: 370-375
[学会発表] 実世界知識を扱う音声対話技術とサービスロボットへの応用
- 著者名/発表者名
  杉浦孔明
- 学会等名
  第80回ロボット工学セミナー
- 発表場所
  東京大学（東京都文京区）
- 招待講演
[学会発表] 実世界知識を扱う音声対話技術とクラウドロボティクスへの展開
- 著者名/発表者名
  杉浦孔明
- 学会等名
  第39回人工知能学会 AI チャレンジ研究会
- 発表場所
  京都大学（京都府京都市）