研究課題/領域番号 |
26280098
|
研究機関 | 立命館大学 |
研究代表者 |
玄 相昊 立命館大学, 理工学部, 准教授 (30344691)
|
研究分担者 |
松原 崇充 奈良先端科学技術大学院大学, 情報科学研究科, 准教授 (20508056)
大塚 光雄 立命館大学, スポーツ健康科学部, 助教 (20611312)
下ノ村 和弘 立命館大学, 理工学部, 准教授 (80397679)
有木 由香 立命館大学, 理工学部, 助教 (80553239) [辞退]
|
研究期間 (年度) |
2014-04-01 – 2018-03-31
|
キーワード | 運動学習 / ヒューマノイド |
研究実績の概要 |
本研究では人から教示される情報に基づいて難易度の高い運動を学習するしくみを人型ロボットを用いて探求している。
昨年度までにKullback-Leibler制御と呼ばれる確率最適制御理論に基づく新しい見まね学習法が提案された。本年度は総まとめとして、昨年度までの成果を論文にまとめるための実験データ取得作業に集中した。提案手法はシミュレーションで有効性を確認できていたが、実ロボットに適用する際、状態遷移確率の取得のために、様々な工夫が必要であった。そこで本年度は全身ヒューマノイドロボットのかわりに、昨年度から運用を開始した双腕ロボットの実験環境整備とデータ取得実験に時間を割いた。その過程で必要になったロボットの改造、共著者との打合せを行った。
既に学会発表した実験の追試実験を行い、様々な見真似タスクについて容易にデータを取得できる環境と実験プロセスを構築し、いくつかのデータを取得することができた。具体的には、昨年度行った、マニピュレータの手先の接触を維持しつつ、教示軌道に追従させるタスクに加え、マニピュレータ先端の棒を振り上げるタスクを追加した。後者については教示軌道によって初期の学習は進むが、安定化のタスクが難しいため、状態遷移モデルのサンプリング時間の調整に工夫を要するなど、様々な実問題に直面した。現在、適用可能性についての限界を含めて、結果を論文にとりまとめている。また、提案手法を他のモデルベース強化学習法と比較するため、追試実験を行っている。
|
現在までの達成度 (段落) |
29年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
29年度が最終年度であるため、記入しない。
|