動物が合目的な行動を行う時,脳内では,どのような計算がなされているのだろうか?これまでの研究から、条件が定期的に変化する課題では,長期的な学習の結果,動物が報酬条件の変化するタイミングを予期してしまう,という報告が複数存在する.我々は,課題の報酬条件が定期的に変化する課題を学習させたマウスは,予測的に行動を変化できる事を見出した.具体的には,報酬が10回出ると報酬条件が変わる課題を学習させると,報酬が10回目で逆転行動を行うマウスが現れた.これらの結果は,マウスが過去の履歴のみならず,予測から価値を計算している事を意味していた。我々はこの報酬条件が逆転する事を予期するマウスを用いて,予測に基づく価値を表現する神経細胞が集まる脳領域を同定し、その脳領域が実際に予測的行動に用いられているかを検証した。本研究の結果は以下の通りである。 1)二光子カルシウムイメージング法を用いて、行動選択に関わるとされる皮質2次運動野のなかでも、将来の行動を表現する細胞が集まるとされる第5層の神経細胞から計測を行った。その結果、2)行動(舐め)の開始に向けて活動が高まる準備活動ニューロンが20~40%ほど含まれていた。さらに、3)それらの神経活動は舐める方向と,報酬期待を同時に表現する事がわかった。4)強化学習モデルによる解析では、報酬期待には予測に基づいた期待値の成分が、予測的な行動をするマウスでのみ検出された。5)2次運動野の予測的な期待値が実際に予測的な行動に使われているか,因果関係を明らかにするため、皮質の多点をほぼ同時に光刺激するデバイスを作成した。6)準備活動中の神経活動を抑制すると、予測的な逆転ができなくなり、あたかも初心者のような行動に戻った。本研究結果から、2次運動野は高度な予測に基づいて行動にバイアスをかけるために重要である事が明らかになった。
|