2013 Fiscal Year Annual Research Report

強化学習を用いた進化論的生物型ロボットの行動形態獲得の研究

Research Project

Project/Area Number	23500275
Research Institution	Yokohama National University
Principal Investigator	藪田哲郎横浜国立大学, 工学研究院, 教授 (30323926)
Co-Investigator(Kenkyū-buntansha)	豊田希横浜国立大学, 工学研究院, 研究教員 (60547222)
Keywords	強化学習 / 生物型ロボット / 大車輪ロボット / 報酬操作 / 前進行動形態 / ロボットハンド
Research Abstract	今年度は昨年度に引き続き、強化学習に人間の主観報酬を用いて、イモムシロボットが最大前進行動距離を獲得する行動形態について検討を進めた。報酬の大きさを同一条件で比較すると、センサから与えられる客観報酬よりも、このロボットの運動を良く熟知した人が与える報酬から得られる行動形態はより大きな前進距離を獲得した。この理由は、人間は生物の行動から類推して、より前進行動が得られる姿勢に着目して主観報酬を与えており、人間の主観報酬の多様性を明らかにすることができた。次に、マルコフ性を保証できない大車輪ロボットの強化学習では確率的な挙動に支配されるが、この確率的な挙動は行動分析には困難である。そのため、学習回数とともに、前回り後回りの成功確率と失敗確率を図面に可視化し、その学習回数と回転確率の変化パターンから行動形態の分析を行った。エネルギ報酬、ロボットの姿勢報酬を複数用いて検討をしたが、この手法を用いるとそれぞれの報酬の特徴が解明され、運動エネルギ報酬が最も回転を実現しやすい事を明らかにした。強化学習を用いた生物ロボットの動的な行動形態の獲得については、エネルギ最少で前進行動を最大化する報酬を用いた行動形態を学習させると、Hoytらの示した離散的な移動モード以外でも報酬が最少化する行動形態が得られた。これは、生物では行動の対称性が必要とされるが、生物ロボットの場合は行動の対称性という束縛がないので、非対称行動も獲得可能であり、生物とは異なる行動形態が獲得されることを明らかにした。最後に、マニピュレータ・ハンドシステムの研究では、仮想剛性で対象物を把持する手法でのインピーダンス制御およびアドミッタンス制御の比較検討を行い、その特徴を解明した。

Research Products
(7 results)

All 2013 Other

All Journal Article (5 results) (of which Peer Reviewed: 5 results) Presentation (1 results) Remarks (1 results)

[Journal Article] Comparison Between Admittance and Impedance Control of a Multi-Finger-Arm Robot Using the Guranteed Manipulability Method2013
- Author(s)
  DaisukeYAMADA, JiangHUANG, TetsuruYABUTA
- Journal Title
  
  Precision Instrument and Mechanology
  
  Volume: Vol.2,Iss.1 Pages: pp.85-93
- Peer Reviewed
[Journal Article] 主観報酬を用いた強化学習における人間の教示特性に関する考察2013
- Author(s)
  黒田将史、山科亮太、藪田哲郎
- Journal Title
  
  日本機械学会論文集、Ｃ編
  
  Volume: Vol.79,No.801 Pages: pp.1770-1774
- Peer Reviewed
[Journal Article] 内力外力インピーダンスモデルを用いた物体把持手法に関するインピーダンス制御とアドミッタンス制御の比較2013
- Author(s)
  佐野嘉則、堀良太、藪田哲郎
- Journal Title
  
  日本機械学会論文集、Ｃ編
  
  Volume: Vol.79,No.807 Pages: pp.4330-4334
- Peer Reviewed
[Journal Article] 確率的ゆらぎを有する強化学習を用いた大車輪ロボットの行動獲得と報酬の関係について2013
- Author(s)
  東浦拓也、松本悟、藪田哲郎
- Journal Title
  
  日本機械学会論文集、Ｃ編
  
  Volume: Vol.79,No.807 Pages: pp.4335-4339
- Peer Reviewed
[Journal Article] 可操作度保持型マルチフィンガ・アームロボットの協調的アドミッタンス制御における動的特性2013
- Author(s)
  山田大輔、佐野嘉則、堀良太、黄健、藪田哲郎
- Journal Title
  
  日本機械学会論文集、Ｃ編
  
  Volume: Vol.79,No.808 Pages: pp.5010-5014
- Peer Reviewed
[Presentation] Dynamic Movement by Admittance Control of a Multi-Finger-Arm Robot with Munipulabikity Control of Fingers2013
- Author(s)
  D.YAMADA,Y.SANO,R.HORI,JHUANG,T.YABUTA
- Organizer
  IEEE/SICE International Symposium on System Integration
- Place of Presentation
  KOBE,JAPAN
- Year and Date
  20131205-20131217
[Remarks] 藪田研ホームページ
- URL
  http://yabsv.jks.ynu.ac.jp/

2013 Fiscal Year Annual Research Report

強化学習を用いた進化論的生物型ロボットの行動形態獲得の研究

Principal Investigator

藪田 哲郎 横浜国立大学, 工学研究院, 教授 (30323926)

Research Products

[Journal Article] Comparison Between Admittance and Impedance Control of a Multi-Finger-Arm Robot Using the Guranteed Manipulability Method2013

Author(s)

Journal Title

[Journal Article] 主観報酬を用いた強化学習における人間の教示特性に関する考察2013

Author(s)

Journal Title

[Journal Article] 内力外力インピーダンスモデルを用いた物体把持手法に関するインピーダンス制御とアドミッタンス制御の比較2013

Author(s)

Journal Title

[Journal Article] 確率的ゆらぎを有する強化学習を用いた大車輪ロボットの行動獲得と報酬の関係について2013

Author(s)

Journal Title

[Journal Article] 可操作度保持型マルチフィンガ・アームロボットの協調的アドミッタンス制御における動的特性2013

Author(s)

Journal Title

[Presentation] Dynamic Movement by Admittance Control of a Multi-Finger-Arm Robot with Munipulabikity Control of Fingers2013

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks] 藪田研ホームページ

URL

藪田哲郎横浜国立大学, 工学研究院, 教授 (30323926)