2006 Fiscal Year Annual Research Report
タスク環境に適応するための行為の能動的学習過程の構成論的解明
Project/Area Number |
18047028
|
Research Institution | The Institute of Physical and Chemical Research |
Principal Investigator |
谷 淳 独立行政法人理化学研究所, 動的認知行動研究チーム, チームリーダー (60425634)
|
Co-Investigator(Kenkyū-buntansha) |
菅野 重樹 早稲田大学, 理工学術院, 教授 (00187634)
有江 浩明 早稲田大学, 理工学術院, 助手 (20424814)
|
Keywords | ニューラルネットワーク / 強化学習 / ワイヤ駆動ロボット |
Research Abstract |
近年,人間の生活環境に入り込みさまざまな作業を支援するロボットの研究開発が盛んに行われているが,そのような環境で適応的に行動することは非常に難しい.一方,ヒトを含めたすべての動物は複雑な環境において適応的に行動できる運動機能を備えている.本研究では,このような適応的な運動機能は環境とロボットとの相互作用を通して生まれると考え,ロボットが自発的に運動学習を行うメカニズムを提案することを目的とする. これまでの研究で,連続量の学習に適したニューラルネットワークであるCTRNNを用いて強化学習を行うアルゴリズムの定式化を行い,1自由度の振り子の振り上げ・倒立制御の学習に適用したが,振り上げ動作は獲得できても倒立させることはできなかった.そこで,CTRNNの学習過程の解析を行った.その結果,CTRNNに新たな試行のデータを学習させると過去に学習したデータを壊してしまうことがわかった.そこで,過去の試行のデータも同時に学習するアルゴリズムを導入した.この新たなアルゴリズムを用いて振り子の課題を行った結果,振り上げ・倒立動作の両方を学習することができ,提案するアルゴリズムの有効性を確認することができた. また,実機ロボットを用いて開発したアルゴリズムを適用し,強化学習を行う場合,ロボットには環境との接触で破壊しないことや,繰り返し試行に耐えられることが求められる.そこで,弾性を持つワイヤ拮抗駆動式のロボットアームの開発を行い,ニューラルネットワークから関節を駆動するワイヤの張力を制御できるように,制御系の設計・開発を行った.
|