研究課題/領域番号 |
24700188
|
研究機関 | 独立行政法人情報通信研究機構 |
研究代表者 |
杉浦 孔明 独立行政法人情報通信研究機構, ユニバーサルコミュニケーション研究所情報利活用基盤研究室, 主任研究員 (60470473)
|
キーワード | 知能ロボティクス / 模倣学習 / 機械学習 / 動作認識 |
研究概要 |
本研究は,刻一刻と変わる環境や状況に対応可能かつ人間らしい自然な動作を再現できる模倣学習手法を開発することを目的とする.今年度は,逐次的な動作生成が可能な模倣学習手法(オンライン模倣)の構築を行った.「XをYにのせる」「Zを回す」などの物体操作の模倣学習手法では,操作軌道を2つのオブジェクト間の相対軌道として表現し,確率モデルを用いて軌道を学習させるものが多い.模倣学習の分野では,隠れマルコフモデル(HMM)を用いて軌道を逐次的に生成する手法(例えば,[Calinonら, IEEE Robotics & Automation Magazine, 2010])が提案されているが,この手法では最尤軌道が得られる保証がない.一方,我々が前年度までに提案した,参照点に依存した隠れマルコフモデル(RPD-HMM; Reference-Point-Dependent HMM)では,最尤軌道の生成は可能であるが逐次的な生成ができないという問題があった.そこで今年度は,RPD-HMMから生成された最尤軌道を基準とした逐次動作生成手法を開発した.これにより,人工的な外力を導入して逐次的に障害物を回避することが可能になる.実験では,非逐次型のベースライン手法との比較評価を行った.その結果,外力を加えた場合であっても,提案手法は滑らかな軌道を生成できるという結果を得た.また,人間が実行した軌道からの生成誤差についても,実用上十分小さいことを確認した.
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題でのH25年度に達成すべき最優先課題は,模倣学習手法における逐次型動作生成(オンライン模倣)であった.この課題を達成するため,RPD-HMMに基づく逐次型動作生成手法の開発に取り組み,(外力が存在しない場合に)最尤軌道を生成するというRPD-HMMの特徴と,逐次的に動作生成が可能という2つの特徴を有する模倣学習手法を開発できた.
|
今後の研究の推進方策 |
H26年度は,(1)逐次型RPD-HMMの改良および上半身動作への適用と,(2)模倣統合システムのサービスロボットへの展開,に取り組む.まず(1)では,これまでに開発したサンプリングベースで軌道を生成する手法と逐次型RPD-HMMの比較を行い,改良および統合を検討する.家事動作などのうち上半身動作に着目してオンライン模倣学習手法を適用する.人間が実行した軌道との二乗誤差を定量的評価指標とする.主観評価では,CG上で生成軌道を被験者に提示し,自然さなどをアンケート評価する.(2)では,オンライン模倣学習手法を台車型ヒューマノイドに実装し,リビングルームを模擬した環境における評価実験を行う.タスク環境として,ロボカップ@ホーム環境を参考にする.客観評価指標として正解軌道との二乗誤差を用いる.
|