研究課題
[目的]報酬に基づく強化学習理論では、予測される報酬と実際に得られた報酬の差(報酬予測誤差)の計算過程が最も重要な問題の一つである。報酬予測誤差をコードするとされるドパミン細胞にはアセチルコリン性細胞の核がある脚橋被蓋核(PPTN)とセロトニン細胞がある背側縫線核(DRN)の投射がある。これらの核が単一神経細胞レベルでどのような報酬情報を計算しているかを調べた。[方法]眼球運動課題を訓練したサルを用いて、PPTNおよびDRNの単一神経活動を記録した。眼球運動のターゲットは右か左であり、それぞれが異なるジュースの量(報酬)と関連付けられている。さらに、嫌悪刺激への反応を古典的条件付け課題で調べた。[結果](1)PPTNのニューロン活動は「報酬の予測」あるいは「実際に与えられた報酬」のどちらかの情報に関与する2種類のpopulationがあることがわかった。(2)同じPPTN細胞でも、課題を行っている場合と行っていないなど、コンテキストの違いにより視覚反応が異なる。以上より、PPTNの神経活動は、ドパミン細胞における報酬予測誤差の主要な要素である「興奮性の報酬信号」・「興奮性の報酬予測信号」に相当し、しかも状況依存的に変化することが示された。(3)眼球運動課題により、DRN細胞の神経活動は、予測される、かつ、得られた報酬量により変化することが示された。すなわち課題の中でのその時々の期待報酬量をコードしている可能性がある。しかも、DRN細胞の半数近くが古典的条件付け課題での期待報酬量もコードしていることがわかった。これまでセロトニンは嫌悪刺激情報に関連するとされてきたが、今回の記録から、同一のDRNニューロンが報酬の予測、獲得と嫌悪刺激の予測や獲得の「両方に」反応するものも多いことが明らかになった。[考察]以上のことからPPTNおよびDRNからは異なる種類の報酬関連情報がドパミン細胞に提供され、報酬予測誤差の計算過程に寄与している可能性が示唆された。
すべて 2010 2009 その他
すべて 雑誌論文 (4件) (うち査読あり 3件) 学会発表 (11件) 備考 (2件)
The Journal of Neuroscience (In press)
Brain and Nerve 61-4
ページ: 397-404
Journal of Neuroscience 29
ページ: 4858-4870
European Journal of Neuroscience 30
ページ: 2211-2223
http://www.kmu.ac.jp/depts/intro/physiol2.html
http://www7.bpe.es.osaka-u.ae.jp/~yasushi/gyoseki.htm