2007 Fiscal Year Annual Research Report
脳幹-中脳神経回路による報酬予測誤差生成機構の解析
Project/Area Number |
18020019
|
Research Institution | Osaka University |
Principal Investigator |
小林 康 Osaka University, 生命機能研究科, 准教授 (60311198)
|
Keywords | monkey / learning / midbrain / dopamine / saccade / motivation |
Research Abstract |
中脳の黒質緻密部や腹側被蓋野のドーパミン細胞(DAcel1)は報酬との連合で学習された手がかり刺激や報酬に対してphasicなバースト応答をすることによって大脳基底核などに報酬予測誤差(報酬に対する予測と現実に得られた報酬の差)を送り,「強化学習におけるシナプス可塑性を制御していると考えられている.Dacellにおいて報酬予測誤差がどうやって計算されるかということは強化学習機構を解明する上'で最も重要な問題の一つであると思われる.Dacellはドーパミン放出によるシナプス可塑性の制御という形で強化学習に重要な役割を果たしており,さまざまな部位から興奮性,抑制性入力を受けているが,それぞれの入力信号の性質が明らかにされていないために,いまだに報酬予測誤差の計算過程がわかっていない.脚橋被蓋核(PPTN)は脳幹のもっとも主要なアセチルコリン性細胞の核であり,古くから睡眠覚醒の調節,運動制御,注意や学習と関係が深いと考えられてきた.また,DAcel1に対してPPTNが最も強力な興奮性入力を供給していることからPPTNからの興奮性入力が,Dacellにおける報酬予測誤差信号の生成に重要な役割を果たしていることが示唆される.本研究ではサルに手がかり刺激で報酬量を予測させるような視覚誘導性サッカードを行わせ,その時のPPTNのニューロン活動を記録し,報酬予測誤差に対するPPTNのニューロン活動の寄与を調べた.報酬予測サッカード課題中のサルPPTNニューロンの活動を記録すると.PPTNの独立したニューロン群で 1)報酬予測の度合いによって大きさが変わる,cue呈示から始まり,サッカード運動あるいは報酬時まで続く持続的応答 2)報酬予測の度合いに無関係で一時的な報酬に対する直接の反応がみられるという実験結果が得られた。
|