ヒトや動物は,過去の経験から習慣的に行動を決めるだけではない.与えられた感覚情報と経験から,現在の状況を推定し,目的志向的に柔軟に行動を決定する.この目的志向行動は,工学分野ではモデルベース戦略に分類される.モデルベース戦略の神経基盤の解明に向けて,まず,初年度に開発したモデルベース型行動課題を,野生型マウスで実施した.マウスの選択行動を,状態推定モデルと単純な強化学習モデルで解析した.状態推定モデルは,状態の遷移確率を,過去の感覚刺激や報酬の有無から推定した.一方,強化学習モデルは,過去の経験から,各行動で得られる報酬を予想した.行動モデル化の結果,マウスの行動は,強化学習モデルではなく,状態推定モデルに適合した.この結果は,マウスの選択行動が,単純なモデルフリー戦略ではないことを示唆する. 次に,本研究の行動課題を,遺伝子改変マウスで実施した.同マウスは,抑制性細胞に選択的にChR2を発現する.青色レーザーで脳領野を光刺激することで,対象領野を抑制できる.上述の行動課題時に,レーザー走査型顕微鏡で,マウスの背側皮質の任意の領野を光抑制した結果,前外側運動皮質 (anterior lateral motor cortex: ALM) の抑制で,マウスの選択行動が変化することを確かめた.今後,光抑制時のマウスの行動を精査することで,モデルベース戦略に必須な領野を同定する.また光抑制の時刻を変えることで,各領野が行動選択に寄与する時刻を同定する.
|