研究課題/領域番号 |
23500275
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
感性情報学・ソフトコンピューティング
|
研究機関 | 横浜国立大学 |
研究代表者 |
藪田 哲郎 横浜国立大学, 工学研究院, 教授 (30323926)
|
研究分担者 |
豊田 希 横浜国立大学, 工学研究院, 研究教員 (60547222)
|
研究期間 (年度) |
2011 – 2013
|
研究課題ステータス |
完了 (2013年度)
|
配分額 *注記 |
5,070千円 (直接経費: 3,900千円、間接経費: 1,170千円)
2013年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2012年度: 1,430千円 (直接経費: 1,100千円、間接経費: 330千円)
2011年度: 2,210千円 (直接経費: 1,700千円、間接経費: 510千円)
|
キーワード | 強化学習 / 生物型ロボット / 大車輪ロボット / 報酬操作 / ロボットハンド / 人間計測 / 前進行動形態 / Q学習 / 主観報酬 / ハンド / スポーツ型ロボット / 前進歩行形態 / 大車輪運動 |
研究概要 |
強化学習を用いて人工生物型ロボット行動獲得を分析し、進化論的な観点からの考察を行おうとしたものである。昆虫、爬虫類、哺乳類と対称を変化させながら検討をすすめ、昆虫と爬虫類の比較では、脊椎がエネルギ効率の良い前進行動の獲得と密接な関係があることを明らかにし、哺乳類では行動の対称性がエネルギ効率の良い行動形態を少なくしていることを明らかにした。また、マルコフ性が保証されない大車輪ロボットを対象にし、確率的な挙動を可視化する手法を考案し、各種報酬と大車輪成功の関係を解明した。次に、人間が与える主観報酬は過去から未来への予測ができるので、現在のみに起因する客観情報よりも良い結果を与えることを示した。
|