研究課題/領域番号 |
17K14622
|
研究種目 |
若手研究(B)
|
配分区分 | 基金 |
研究分野 |
知能機械学・機械システム
|
研究機関 | 名古屋大学 |
研究代表者 |
有泉 亮 名古屋大学, 工学研究科, 助教 (30775143)
|
研究期間 (年度) |
2017-04-01 – 2019-03-31
|
研究課題ステータス |
完了 (2018年度)
|
配分額 *注記 |
4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2018年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
2017年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 応答曲面法 / ロボット / 機械学習 / 運動学習プリミティブ / データ駆動 / 学習 / アルゴリズム / 最適化 |
研究成果の概要 |
本研究では応答曲面法を用いた冗長ロボットの強化学習法を確立することを目的とした.応答曲面法は少ないサンプルを基に最適パラメータを探索でき,特に低次元問題に有効である.冗長ロボットの場合,時間などの問題から多数のサンプルを得ることは難しいことから,応答曲面法の適用が望ましい.ところが,一般に決定変数空間が高次元であり,応答曲面法の適用は容易ではない.そこで,低計算コストでありサンプル回数に制約は無いが信頼性の低いシミュレーションと,信頼性は高いがサンプル数が限られる高精度なシミュレーション・実験とを併用して,適切に学習を進める方法を提案した.
|
研究成果の学術的意義や社会的意義 |
ロボットの運動決定法として強化学習が注目されているが,多数のサンプルを必要とし,実際のロボットへの適用は難しい.このため,簡易なシミュレーションを活用することが考えられるが,モデル化誤差が実システムでの学習に悪影響を及ぼすことが知られている.本研究で提案する手法では,モデル化誤差による悪影響を回避しながら,簡易シミュレーションを有効に活用して,実システムにおけるサンプル回数の大幅な削減を実現する.これにより,既存の強化学習では適用困難であった高次元なロボットシステムに対しても,強化学習による最適運動の探索が可能となる.
|