2006 Fiscal Year Annual Research Report
学習システムを備えた生物規範に基づく2足歩行の実現
Project/Area Number |
05J02829
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松原 崇充 奈良先端科学技術大学院大学, 情報科学研究科, 特別研究員(DC1)
|
Keywords | 2足歩行 / 生物規範 / 強化学習 / ヒューマノイド / 全身協調動作 / 倒立振子モデル |
Research Abstract |
実世界で自律的に環境の変化に適応する生物の運動は,中枢神経系により構成されるパターン発生器(Central Pattern Generator CPG)及び,様々な運動器官からCPGへのセンサフィードバックによって生成されていることが,神経生理学の研究によって示唆されている.このような生物規範に基づく制御則を実ロボットに適用することで環境の変化に対してロバストな制御の実現が期待出来る.しかし,そのような性質を得るためには,明確な設計原理のないCPGのパラメータ等を適切に調節する必要があることが間題であった.本研究では,強化学習の一手法である方策勾配法に基づく学習システムを構築することで,数値実験おいてCPGへのセンサフィードバックの方策を自律的に獲得させることに成功し,獲得されたり御方策を用いることで実ロボットにおける,環境やロボットのダイナミクスの変化に笥しロバストな2足歩行を実現した.上記の結果について,国際論文誌1件が出版された. 上記の手法はリズム運動の学習に適した手法であるため,リズム運動以外の全身運動を学習により獲得,または環境の変化に応じて適切に修正するためには新たな学習の枠組みを提案する必要がある.人間のダイナミクスは近似的に倒立振子モデルで説明されることが知られており,運動生埋学やロボット工学の分野で様々な運動の説明や実現に広く使われている.我々は,このような汎用立性の高いモデルに基づいて.効率的に全身運動を学習・獲得させることを試みた.具体的には、倒立振子の状態・行動空間においてタスクを達成するための適切な重心の制御則を学習し,獲得された重心の運動は全身の関節運動へと変換される.提案手法を,21自由度を有するヒューマノイドロボットにおけるインパクト動作の学説題に適用した結果,数千回の試行回数により適切な全身運動が学習できることを数値実験により確認した.この成果に基づいて,国際学会に付属する研究会で1件の発表を行い,国際学会1件が既に採択済みである.
|
Research Products
(1 results)