沖縄大学院大学・銅谷賢治氏、京都府立医科大学・上田康雅助手、木村實教授と共同で、選択肢ごとのメリットを表現する神経細胞が大脳基底核・線条体にあることを発見した。行動を選択するとき、過去に経験した行動と結果により各行動のメリット(行動価値)を学習し、それを比較しながら選択を行っている。このような報酬の経験による行動価値の学習と意思決定の脳内プロセスを調べるために、自由に行動を選択する課題を学習中のサルの線条体から細胞外電気記録を行った。サルがスティックを左または右に倒す行動の選択肢からいずれかを自由に選ぶと1割、5割、または9割の確率で報酬が得られる。何十回かの試行錯誤の後、左倒しが右倒しよりも報酬確率が高ければ、サルは次第に左倒しを選ぶようになった。スティックを倒す前の1秒間の線条体の神経細胞の活動を調べると、ある細胞は左倒しに対する報酬の確率を1割から9割に増やすにつれて応答が強くなった。一方、左倒しに対する報酬の確率を5割に固定したまま、右倒しに対する報酬を変化させると、行動は左倒しから右倒しに変化するにもかかわらず、神経細胞の活動の強さは変化しなかった。つまり、この神経細胞の行動前の活動は左倒しに対する行動価値を表現している。報酬や失敗の経験から、行動価値を学習し、それを元に行動を確率的に選択するプロセスは「強化学習」と呼ばれる理論によって定式化できる。この理論での学習式の解をサルの行動と報酬の経験から求めることで、サルの次の行動を予測することができた。さらに、線条体の神経活動は、強化学習の学習式で求められるそれぞれの「行動価値」に対応する変数と相関していることが明らかになった。以上の結果は、報酬や失敗を通して複数の選択肢から価値の高い行動を選択するプロセスに、大脳基底核の線条体の神経細胞が深く関わっていることを示唆している。
|