2005 年度実績報告書

計算論と実験検証の統合による皮質・基低屋ループにおける実時間機構

研究課題

研究課題/領域番号	17021057
研究機関	玉川大学
研究代表者	鮫島和行玉川大学, 学術研究所, 講師 (30395131)
キーワード	大脳基底核 / 強化学習 / 線条体 / 意思決定 / 細胞外電気記録 / 行動価値 / 脳の計算論的モデル / サル
研究概要	沖縄大学院大学・銅谷賢治氏、京都府立医科大学・上田康雅助手、木村實教授と共同で、選択肢ごとのメリットを表現する神経細胞が大脳基底核・線条体にあることを発見した。行動を選択するとき、過去に経験した行動と結果により各行動のメリット(行動価値)を学習し、それを比較しながら選択を行っている。このような報酬の経験による行動価値の学習と意思決定の脳内プロセスを調べるために、自由に行動を選択する課題を学習中のサルの線条体から細胞外電気記録を行った。サルがスティックを左または右に倒す行動の選択肢からいずれかを自由に選ぶと1割、5割、または9割の確率で報酬が得られる。何十回かの試行錯誤の後、左倒しが右倒しよりも報酬確率が高ければ、サルは次第に左倒しを選ぶようになった。スティックを倒す前の1秒間の線条体の神経細胞の活動を調べると、ある細胞は左倒しに対する報酬の確率を1割から9割に増やすにつれて応答が強くなった。一方、左倒しに対する報酬の確率を5割に固定したまま、右倒しに対する報酬を変化させると、行動は左倒しから右倒しに変化するにもかかわらず、神経細胞の活動の強さは変化しなかった。つまり、この神経細胞の行動前の活動は左倒しに対する行動価値を表現している。報酬や失敗の経験から、行動価値を学習し、それを元に行動を確率的に選択するプロセスは「強化学習」と呼ばれる理論によって定式化できる。この理論での学習式の解をサルの行動と報酬の経験から求めることで、サルの次の行動を予測することができた。さらに、線条体の神経活動は、強化学習の学習式で求められるそれぞれの「行動価値」に対応する変数と相関していることが明らかになった。以上の結果は、報酬や失敗を通して複数の選択肢から価値の高い行動を選択するプロセスに、大脳基底核の線条体の神経細胞が深く関わっていることを示唆している。

研究成果
(1件)

すべて雑誌論文 (1件)

[雑誌論文] Representation of Action-Specific Reward-Values in the Striatum2005
- 著者名/発表者名
  Kazuyuki Samejima
- 雑誌名
  
  Science 310(5752)
  
  ページ: 1337-1340