2008 Fiscal Year Annual Research Report
中脳ドーパミン系による、長期的な将来報酬の価値と予測誤差の表現機構の解明
Project/Area Number |
08J02233
|
Research Institution | Kyoto Prefectural University of Medicine |
Principal Investigator |
榎本 一紀 Kyoto Prefectural University of Medicine, 医学部, 特別研究員(DC2)
|
Keywords | ドーパミン / 報酬 / 電気生理 / 霊長類 / 強化学習 / 大脳基底核 |
Research Abstract |
本研究は、報酬に基づく意志決定・行動選択・学習に関わる脳神経メカニズムの解明をめざし、その中心的な役割を担っていることが知られている大脳皮質-基底核ループの中でも、特に中脳ドーパミン細胞による報酬価値情報の表現に焦点を当てて実験を行う。ドーパミン細胞の活動は長期的な将来報酬の価値とその予測誤差を表現する、という仮説を検証するため、ニホンザルを被検者として、報酬を得るために複数の選択肢から適切な行動を選択する、1ブロックが複数ステップの報酬獲得からなる意志決定課題を学習させ、電気生理学的手法によって細胞活動の電極記録を行った。課題遂行中の動物から活動を記録した133個の細胞のうち、ドーパミン細胞は90個であった。その活動は、課題開始の合図である視覚刺激に対して、一回のステップで得られる報酬の価値を正確に反映した応答を示し、また、強化因子に対する応答では予測誤差情報の表現が確かめられた。しかしながら、長期的な将来報酬の価値を反映すると考えられる応答は見られず、細胞活動と、強化学習理論に基づいたシミュレーションで得られた報酬価値との相関は小さかった。また、反応時間などの行動学的データからも、実験に用いた動物は長期的な将来報酬を適切に予測できていないことが示唆された。そこで、この問題を発展的に解消し、明確な結果を短期間で得るため、先のステップが予測できる場合と予測できない場合がある、予測される将来報酬が異なる二種類の古典的条件付け課題を学習させ、課題遂行中の動物からドーパミン細胞の活動を記録した。これまでに60個以上の細胞活動データを得ており、先のステップが予測できる場合には、長期的な将来報酬を反映した応答を示すことを確認している。また、パイプの舌舐め運動などの行動学的データからも仮説を支持する手がかりを得ている。
|