2009 Fiscal Year Annual Research Report
カオティックダイナミクス整合によるロボット制御のための強化学習システム
Project/Area Number |
19680012
|
Research Institution | Nagaoka University of Technology |
Principal Investigator |
坪根 正 Nagaoka University of Technology, 工学部, 准教授 (50334694)
|
Keywords | カオティックダイナミクス整合 / ロボット制御 / 強化学習 |
Research Abstract |
本研究課題は,カオティックダイナミクス整合を提案して,自律的に行動を獲得する,ロボット制御のための強化学習システムを実現するものである.カオティックダイナミクス整合とは,カオス理論に基づいて「制御系のダイナミクスを制約条件やタスクに応じて高速・柔軟に適応させる手法」であり,本システムにより,従来よりも少ない学習回数と短い学習時間,従来よりも広い安定化制御可能な状態空間の実現を目標としている.本年度の計画は,前年度に引き続き,同定学習に関する理論構築および簡素な回路実験による検証を進め,教師信号として生体から得られるデータを取得し,その教師データと同等の性質を持つスパイク信号を出力できるように回路のパラメータを更新する為の,基本設計を行うことであった.これに対し,以下の成果を得た. 1. 制御系に関するシンプルな回路モデル:同定学習制御パラメータに関する引き込み領域を理論的に解明し,パラメータ更新を伴う設計手法の有用性を示した. 2. ヒトの脳情報を強化学習に利用し制御システム:実データを用いた検証を進め,スパイク信号を利用した強化学習システムを組み込むための理論が強化された.
|
Research Products
(3 results)