大脳皮質基底核回路の価値学習における機能:二種の皮質線条体細胞の役割に着目して
Publicly Offered Research
Project Area | Brain information dynamics underlying multi-area interconnectivity and parallel processing |
Project/Area Number |
20H05049
|
Research Category |
Grant-in-Aid for Scientific Research on Innovative Areas (Research in a proposed research area)
|
Allocation Type | Single-year Grants |
Review Section |
Complex systems
|
Research Institution | The University of Tokyo |
Principal Investigator |
森田 賢治 東京大学, 大学院教育学研究科(教育学部), 准教授 (60446531)
|
Project Period (FY) |
2020-04-01 – 2022-03-31
|
Project Status |
Completed (Fiscal Year 2021)
|
Budget Amount *help |
¥3,250,000 (Direct Cost: ¥2,500,000、Indirect Cost: ¥750,000)
Fiscal Year 2021: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Fiscal Year 2020: ¥1,690,000 (Direct Cost: ¥1,300,000、Indirect Cost: ¥390,000)
|
Keywords | 強化学習 / ドーパミン / 大脳皮質 / 大脳基底核 / 依存 / 価値学習 |
Outline of Research at the Start |
大脳皮質-基底核-ドーパミン神経系は価値学習・意思決定に肝要だと示唆され、様々な回路機構が示唆・提案されてきた。しかし、(1)二種類の皮質線条体細胞の役割分担が不明、(2)報酬予測誤差の計算機構が不明、(3)基底核の直・間接路が良さ・悪さの学習に関わるという有力な説にも課題となる事柄が存在などの問題点がある。本研究では、研究代表者らが最近提案した仮説の精緻化を含め、数理モデル構築・検証法の探求を行い、これらの問題に取り組んでいく計画である。
|
Outline of Annual Research Achievements |
大脳皮質の異なる神経細胞集団(領域・細胞種)において異なる状態・行動表現法(successor representation (SR)と呼ばれる、ある状態・行動を後継の状態・行動への(時間割引を考慮した)累積将来滞在によって表すような表現法と、個々の状態・行動を個別的に表す表現法)が用いられている可能性、および、異なる皮質細胞集団が、大脳基底核線条体の直接路・間接路細胞(それぞれ正・負のフィードバックからの学習に大きく関わることが示唆されてきた)に均等ではなく入力する可能性を踏まえ、SRを用いる系と個別的表現を用いる系を組み合わせ、それぞれの系が正および負の報酬予測誤差から異なる学習率で学習し得るようなエージェントモデルを考えた。そして、グリッド空間内で報酬が高い確率で得られる位置が変化していくような動的な環境の空間的報酬探索獲得課題におけるエージェントの行動のシミュレーションを行った。その結果、その課題において、SRを用いる系が正の予測誤差からの方が負の予測誤差からよりも大きく学び、一方個別的表現を用いる系が負の予測誤差からの方が正の予測誤差からよりも大きく学ぶような組み合わせが、高いパフォーマンスを示すことを見出した。また、そうした組み合わせが、報告されている実験知見・示唆(異なる皮質領域・細胞種から直接路・間接路への結合・入力、異なる皮質細胞種の皮質内結合様態、SR様の表現が存在することが推測される部位など)と符合しうる可能性を検討・提案した。
|
Research Progress Status |
令和3年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和3年度が最終年度であるため、記入しない。
|
Report
(2 results)
Research Products
(6 results)