研究領域 | 脳情報動態を規定する多領野連関と並列処理 |
研究課題/領域番号 |
20H05049
|
研究種目 |
新学術領域研究(研究領域提案型)
|
配分区分 | 補助金 |
審査区分 |
複合領域
|
研究機関 | 東京大学 |
研究代表者 |
森田 賢治 東京大学, 大学院教育学研究科(教育学部), 准教授 (60446531)
|
研究期間 (年度) |
2020-04-01 – 2022-03-31
|
研究課題ステータス |
完了 (2021年度)
|
配分額 *注記 |
3,250千円 (直接経費: 2,500千円、間接経費: 750千円)
2021年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
2020年度: 1,690千円 (直接経費: 1,300千円、間接経費: 390千円)
|
キーワード | 強化学習 / ドーパミン / 大脳皮質 / 大脳基底核 / 依存 / 価値学習 |
研究開始時の研究の概要 |
大脳皮質-基底核-ドーパミン神経系は価値学習・意思決定に肝要だと示唆され、様々な回路機構が示唆・提案されてきた。しかし、(1)二種類の皮質線条体細胞の役割分担が不明、(2)報酬予測誤差の計算機構が不明、(3)基底核の直・間接路が良さ・悪さの学習に関わるという有力な説にも課題となる事柄が存在などの問題点がある。本研究では、研究代表者らが最近提案した仮説の精緻化を含め、数理モデル構築・検証法の探求を行い、これらの問題に取り組んでいく計画である。
|
研究実績の概要 |
大脳皮質の異なる神経細胞集団(領域・細胞種)において異なる状態・行動表現法(successor representation (SR)と呼ばれる、ある状態・行動を後継の状態・行動への(時間割引を考慮した)累積将来滞在によって表すような表現法と、個々の状態・行動を個別的に表す表現法)が用いられている可能性、および、異なる皮質細胞集団が、大脳基底核線条体の直接路・間接路細胞(それぞれ正・負のフィードバックからの学習に大きく関わることが示唆されてきた)に均等ではなく入力する可能性を踏まえ、SRを用いる系と個別的表現を用いる系を組み合わせ、それぞれの系が正および負の報酬予測誤差から異なる学習率で学習し得るようなエージェントモデルを考えた。そして、グリッド空間内で報酬が高い確率で得られる位置が変化していくような動的な環境の空間的報酬探索獲得課題におけるエージェントの行動のシミュレーションを行った。その結果、その課題において、SRを用いる系が正の予測誤差からの方が負の予測誤差からよりも大きく学び、一方個別的表現を用いる系が負の予測誤差からの方が正の予測誤差からよりも大きく学ぶような組み合わせが、高いパフォーマンスを示すことを見出した。また、そうした組み合わせが、報告されている実験知見・示唆(異なる皮質領域・細胞種から直接路・間接路への結合・入力、異なる皮質細胞種の皮質内結合様態、SR様の表現が存在することが推測される部位など)と符合しうる可能性を検討・提案した。
|
現在までの達成度 (段落) |
令和3年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和3年度が最終年度であるため、記入しない。
|