• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

腱駆動2足歩行ロボットの行動戦略・関節剛性の強化学習

Research Project

Project/Area Number 21560275
Research InstitutionMeiji University

Principal Investigator

小林 博明  明治大学, 理工学部, 教授 (60130811)

Co-Investigator(Kenkyū-buntansha) 田中 純夫  明治大学, 理工学部, 講師 (40287884)
Keywords機械学習 / ロボティックス / 制御工学
Research Abstract

本研究は罰と報酬を用いる強化学習法を腱駆動方式歩行ロボットに適用することよって,効率的で多機能な腱駆動式2足歩行ロボットを実現することを目的としている.腱駆動2足歩行ロボットの場合,歩行の安定性以外に腱の緩みや腱の破断などの危険があり,従来のニューラルネットによる学習法では学習が困難であるからである.そこで,申請者等は強化学習法として,報酬割り当て法と改良型罰回避政策形成アルゴリズムを組み合わせて用いることとし,平成21年度から研究を行っている.
昨年度の研究から(1)固定状態導入の効果の評価法が不明確であること,(2)罰状態の伝播速度が遅く、あまり有効に働いていないこと,(3)ZMP許容誤差が実機に比べ大きいこと、(3)実機の腱張力制御の精度が不十分であること,が分かった.
そこで、平成23年度には次の事を行った.(a)固定状態導入法の評価法としてマルチスタート法に基づいた評価法を用いることを提案し、学習パラメータの評価を行った。(b)それまでの罰度を用いた罰回避法に対して、そのルールを用いた場合に将来失敗する予想確率を用いる新しい罰回避を提案し、その有効性を検証した。(c)GAを用いて学習パラメータを再検討し、実機に対応したZMP許容誤差に対する歩行が実現できるようにした。(d)水平歩行に対する学習結果を階段歩行に用いることで、学習時間の短縮が図れることを確認した。(e)これまでの腱張力制御器にNSTを用いたI-PD制御法を導入し、精度の向上を行った。また、Mathematicaとvisual Nastran 4Dを用いて、2足歩行ロボソトの関節トルクの検証を行った。

  • Research Products

    (5 results)

All 2012 2011

All Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (3 results)

  • [Journal Article] Introduction of Fixed Mode States into Online Profit Sharing and Its Application to Waist Trajectory Generation of Biped Robot2012

    • Author(s)
      Seiya Kuroda, Kazuteru Miyazaki, Hiroaki Kobayashi
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7188 Pages: 293-308

    • Peer Reviewed
  • [Journal Article] Evaluation of the Improved Penalty Avoiding Rational Policy Making Algorithm in Real World Environment2012

    • Author(s)
      Kazuteru Miyazaki, Masaki Itou, Hiroaki Kobayashi
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 7196 Pages: 270-280

    • DOI

      10.1007/978-3-642-28487-8_28

    • Peer Reviewed
  • [Presentation] 腱駆動2足歩行ロボットにおける腰軌道の強化学習への固定状態導入による効率化の研究2011

    • Author(s)
      伊藤大貴、岡島勇也、田中純夫、小林博明、宮崎和光
    • Organizer
      第54回自動制御連合講演会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      2011-11-20
  • [Presentation] 罰と報酬を用いる強化学習の失敗確率伝播に関する研究2011

    • Author(s)
      村岡宏紀、宮崎和光、小林博明
    • Organizer
      第54回自動制御連合講演会
    • Place of Presentation
      豊橋技術科学大学
    • Year and Date
      2011-11-20
  • [Presentation] Introduction of Fixed Mode States into Online Profit Sharing and Its Application to Waist Trajectory Generation of Biped Robot2011

    • Author(s)
      Seiya Kuroda, Kazuteru Miyazaki, Hiroaki Kobayashi
    • Organizer
      The 9th European Workshop on Reinforcement Learning (EWRL-9)
    • Place of Presentation
      Athens Royal Olympic Hotel
    • Year and Date
      2011-09-11

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi