2007 Fiscal Year Annual Research Report
学習システムを備えた生物規範に基づく2足歩行の実現
Project/Area Number |
05J02829
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
松原 崇充 Nara Institute of Science and Technology, 情報科学研究科, 特別研究員(DC1)
|
Keywords | 2足歩行 / 生物規範 / 強化学習 / ヒューマノイド / 全身協調動作 / 倒立振子モデル / 方策勾配法 / 方策こう配法 |
Research Abstract |
人間のダイナミクスは近似的に倒立振子モデルで説明されることが知られており,運動生理学やロボット工学の分野で様々な運動の説明や実現に広く使われている.我々は,このような汎用性の高いモデルに基づいて,ロボットの全身運動を効率的に学習・獲得させることを試みた.具体的には、倒立振子の状態・行動空間においてタスクを達成するための適切な重心制御則を学習し,獲得された重心の運動は全身の関節運動へと変換される.提案手法を,21自由度を有するヒューマノイドロボットにおけるインパクト動作の学習課題に適用した結果,数千回の試行回数により適切な全身運動が学習できることを数値実験により確認した.この成果に某づいて,国際学会で発表1件を行い,さらに論文誌1件への掲載が決定された.また,倒立振子モデル上での運動を全身関節の運動へと分配する際に問題となる不良設定性を,人の見本動データに基づいて解決する方法を提案し,シミュレーション実験によりその有効性を示した.この成果について,国内学会での発表1件を行った. さらに,より効率的な運動学習・環境適応性を実現するため,平均報酬の計量空間における強化学習法を提案した.提案手法は,強化学習の目的関数である平均報酬の計量空間上での方策勾配法であり,従来法で問題であったプラトー現象と呼ばれる学習の停滞を生じることなく,効率的な学習が実現される.また,極値付近では2次収束性も有している.この成果について,国内の研究会での発表1件を行った.今後は,2足歩行や全身運動のようなロボットの複雑な運動の学習に対する適用を目指す.
|
Research Products
(6 results)