2008 Fiscal Year Annual Research Report
行動選択の価値のアップデートと記憶におけるドーパミン系と眼窩前頭皮質の役割
Project/Area Number |
20240040
|
Research Institution | Kyoto Prefectural University of Medicine |
Principal Investigator |
木村 實 Kyoto Prefectural University of Medicine, 医学研究科, 教授 (40118451)
|
Co-Investigator(Kenkyū-buntansha) |
松本 直幸 京都府立医科大学, 医学研究科, 講師 (00252726)
|
Keywords | システム神経生理 / ニューロインフォマティクス / 価値判断 |
Research Abstract |
木村らの従来の研究によって、ドーパミン細胞が、将来行う複数ステップの行動の報酬価値情報を担うことによって、現時点では最も望ましい選択肢の選択が不可能である場合においても将来的にトータルの報酬量を最大にする形で目標に到達するアルゴリズムを提供することを示唆する知見を得て、論文投稿し、査読者のアドバイスによって確証実験を行った。サルを実験動物に、ボタン押し行動によってスタートする古典的条件付け行動を行わせた。すなわち、スタートを指示する視覚刺激を合図にボタンを押さえると、報酬の確率が20%,50%,80%,100%であることを示す4種類の視覚条件刺激が提示され、その2秒後に無条件刺激(ビープ音)が現れ、更に提示された確率で報酬が与えられた。4つの条件刺激が不規則な順番で現れる場合と、20-50-80-100%の順番で現れる場合を設定した。不規則条件では、ドーパミン細胞の条件刺激に対する応答は報酬確率(価値)を良く反映し、無条件刺激に対する応答は報酬予測誤差を反映することが判明した。一方、規則的順番条件では無条件刺激に対する応答は報酬予測誤差を良く反映したが、条件刺激応答が減弱して報酬価値を表現しないことが明らかになった。重要なことに、条件刺激に先行して現れるスタート刺激に対して強い応答生じることが分かった。この結果は、強化学習理論で推定される結果と矛盾しない。この応答は、複数ステップにわたる将来の試行を統合した報酬価値情報を担うと考えられるが、ドーパミン細胞の応答の定量的解析、そして強化学習理論を踏まえて詳細に検討し、日本神経科学学会大会(21年9月開催)で報告する。
|
Research Products
(6 results)