研究概要 |
動物は未知の新しい環境において試行錯誤を通して適切な行動系列を獲得していくことができる.この行動系列の強化学習が行えるためにはつぎの2つの機能が必要である:1,多様な行動系列が生成できること(試行錯誤).2,報酬を得たとき生成した行動系列のどの部分が報酬を引き出したのかを知覚できること.本年度は大脳運動野一視床系が以上の2つの機能を持ちうろことをこの系の神経回路モデル上で示唆した.以下に結果を示す. 1, 上記の系の神経回路モデルを生理学・解剖学に基づいて構成した.細胞には積分発火型のモデルを用いた.回路モデルによる上記系の挙動のシミュレーションによりこの系が乱数発生装置と同程度に多様な行動系列を生成できることを示した.2, 強化学習機能を実現する機構として,体性感覚野から運動野へのフィードバック投射および前頭連合野からの投射にシナプス可塑性を導入した.前者により運動野一視床系は直前の行動によって生じた体の姿勢変化を体性感覚情報として受け取り先の行動を次の行動を出力できようになる.後者の投射により同系は環境の状態を反映した行動系列を出力できるようになる.この機構がどの程度系列を学習できるかを調べるために生理学および解剖学のデータに基づいて上記のシナプス可塑性をモデル化し,回路モデルのシミュレーションにより長さ2の行動系列を学習できることを確かめた.これから運動野一視床系の神経回路は行動系列の学習に関わっていることが示唆された.
|