これまで解剖学的、あるいは断片的な生理学的知見より脳幹のアセチルコリン作動性ニューロンの核である脚橋被蓋核(PPTN)が報酬に基づく学習や動機付けの形成に必要であることが明らかにされてきた。眼前のいくつかの場所に一定時間、光点を順番に呈示すると、ヒトやサルは光点を一定時間注視し、新しい光点があわわれると、その光点を標的として衝動性眼球運動(サッカード)とよばれる非常に速い眼球運動で視野移動を行う。注視中に新しい標的が現れてからサッカードが起きるまでの反応時間は空間的注意や動機付けと関係していることが良く知られているが、たとえばサルが「どの点に向かって」、あるいは「いつサッカードするのか」ということは誤差信号や報酬による学習によって系統的に修正され得るものと思われる。学習には外部から与えられる誤差信号、報酬と内的状態(報酬や誤差信号の履歴による動物の動機付けや空間的注意)が重要な要素となるはずであるが、これら要素の相互関係は明らかにされていなかった。 サルの視覚誘導性サッカード課題において、課題成功後に与えられる報酬量を増加させると課題の成功率が上昇すると同時に課題開始時に点灯する注視点へのサッカードの反応時間が減少すると同時にPPTNニューロンの注視点点灯時の持続的応答が上昇するという実験結果を得た。この反応は課題の遂行度合い〔成功率〕という動機付けや課題に対する注意を反映する指標と密接に関係していると思われる。さらにこれらのニューロンはサッカード運動時や課題後の報酬に対して直接あるいは予測的に反応することを明らかにした。この結果は単一PPTNニューロン上で誤差信号、報酬信号、動機付けに関する情報が収束することを示しており、誤差信号や報酬に基づく学習の際に必要な、異種感覚情報の統合にPPTNを含む神経回路が重要な役割を果たしていることを示していると思われる。
|