研究課題
基盤研究(C)
本研究では、様々な状況でどのように行動すればよいかを、罰と報酬を用いてロボット自身に学習させる手法を検討し、それをロボットサッカーゲームでの行動学習と2足歩行ロボットの歩行機能の学習に適用した。その際、実際のロボットに適用できるように、罰を与える基準の決定法、十分学習の進んだ状態は固定状態(一定の行動戦略を使用する状態)とするなど、学習の効率化を図った。また、人間と同様にモータ(筋肉)とワイヤー(腱)で駆動される2足歩行ロボットの機構と制御について研究した。2足歩行ロボットの腱には約400N(40kgf)の力が加わるため、壊れにくい剛性調整装置を用い、腱張力の制御を行った。
すべて 2012 2011 2010 2009 その他
すべて 雑誌論文 (4件) (うち査読あり 4件) 学会発表 (9件) 備考 (1件)
Lecture Notes in Computer Science
巻: Vol.7196 ページ: 270-280
巻: Vol.7188 ページ: 297-308
Proc. of SICE Annual Conference 2010
ページ: 3240-3245
Journal of Advanced Computational Intelligence and Intelligent Informatics
巻: Vol.13, No.6 ページ: 675-683
http://www.messe.meiji.ac.jp/~iml/sub01/theme.html