2008 Fiscal Year Annual Research Report
セロトニン・アセチルコリン・ドパミンネットワークによる報酬・嫌悪情報処理機構
Project/Area Number |
20300139
|
Research Institution | Kansai Medical University |
Principal Investigator |
中村 加枝 Kansai Medical University, 医学部, 教授 (40454607)
|
Co-Investigator(Kenkyū-buntansha) |
小林 康 大阪大学, 生命機能研究科, 准教授 (60311198)
|
Keywords | セロトニン / ドパミン / アセチルコリン / 脚橋被蓋核 / 縫線核 / 眼球運動 / サル / reinforcement learning |
Research Abstract |
[目的]報酬に基づく強化学習の神経生理学的研究は、自律的に行動するロボットの開発、教育への応用などに強力なインパクトを与える。強化学習理論では予測される報酬と実際に得られた報酬の差(報酬予測誤差)の計算過程が実験的、理論的に最も重要な問題の一つである。報酬予測誤差をコードするとされるドパミン細胞にはアセチルコリン性細胞の核がある脚橋被蓋核(PPTN)とセロトニン細胞がある背側縫線核(DRN)の投射がある。これらの核が単一神経細胞レベルでどのような報酬情報を計算しているかを調べた。 [方法]眼球運動課題を訓練したサルを用いて、PPTNおよびDRNの単一神経活動を記録した。この課題では眼球運動のターゲットは右か左であり、それぞれが異なるジュースの量(報酬)と関連付けられている。さらに、嫌悪刺激への反応も古典的条件付け課題で調べた。[結果](1)PPTNのニューロン活動が「報酬の予測」あるいは「実際に与えられた報酬」のどちらかの情報に関与することが明らかになった。また、PPTNが符号化しているそれぞれの報酬関連活動は計算理論で予言されている、DAcellにおける報酬予測誤差の主要な要素である、「興奮性の報酬信号」、「興奮性の報酬予測のワーキングメモリー」に相当していると思われた。(2)DRN細胞の神経活動は得られた報酬量により変化する。DRN細胞の半数は、神経活動は、得られる報酬の絶対量をコードした。残りの半数は絶対量ではなく、もう一つのターゲットの報酬量との関係により神経活動が変化した。さらにDRNの中には報酬に反応するものと嫌悪刺激に反応するものがあった。[考察]以上のことからPPTNおよびDRNからは異なる種類の報酬関連情報がドパミン細胞に提供され、報酬予測誤差の計算過程に寄与している可能性が示唆された。
|
Research Products
(8 results)