• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2006 年度 実績報告書

計算論と実験検証の統合による大脳皮質-大脳基底核ループの機能的役割

研究課題

研究課題/領域番号 18019033
研究機関玉川大学

研究代表者

鮫島 和行  玉川大学, 学術研究所, 講師 (30395131)

キーワード大脳基底核 / 強化学習 / 線条体 / 意思決定 / 行動価値 / fMRI / 脳の計算論的モデル / 神経生理
研究概要

ATR脳情報研究所/カリフォルニア工科大学の田中沙織氏、沖縄大学院大学(OIST)の銅谷賢治氏と共同で状態が連続的に変化する環境における意思決定課題におけるヒトの脳活動を機能的核磁気共鳴画像(fMRI)を用いて解析した。その結果、連続して状態が変化する環境において、決定論的に状態が変化する場合にはより長期の未来に得られる報酬を最大化するように行動が決定されるが、確率的に状態が変化する場合には、直近の報酬のみを最大化するような行動選択が見られることをしめした。さらに、課題中の脳活動を解析したところ、より長い報酬を考慮したときの脳活動が短い報酬を予測したときの脳活動よりも高い領域として、背外前頭前野・背側線条体であったのに対して、より短い報酬を予測したときの脳活動が高い領域は腹側の線条体であった。このことは、報酬変化がないとしても、状態変化の予測可能性に依存してヒトが将来を見込みなが意思決定する際の時間スケールを適応的に変化させること、その変化に応じて、大脳皮質-大脳基底核に存在する複数のループ回路が使い分けられている可能性を示唆している。この結果は、大脳皮質-大脳基底核ループ回路において、複数の強化学習を行う回路が存在し、その回路が環境や状況に依存して適応的に選択され、使われ、学習される、という計算論的なモデルを示唆している。
ATR脳情報研究所の川人光男所長と共同で、これまでに発表してきた複数の予測モデルを用いた強化学習モデュールアーキテクチャと、脳での複数強化学習の可能性、と強化学習のアルゴリズムであるTD学習が、大脳基底核の線条体と中脳ドーパミン細胞によっていかにして実現されるのか、についての仮説を提案するreview論文を発表した。

  • 研究成果

    (3件)

すべて 2007 2006

すべて 雑誌論文 (3件)

  • [雑誌論文] Efficient reinforcement learning : computational theories, neuroscience and robotics.2007

    • 著者名/発表者名
      Mitsuo Kawato
    • 雑誌名

      Current Opinion in Neurobiology 17

      ページ: 205-212

  • [雑誌論文] Brain mechanism of reward prediction under predictable and unpredictable environmental dynamics2006

    • 著者名/発表者名
      Saori C Tanaka
    • 雑誌名

      Neural Networks 19

      ページ: 1233-1241

  • [雑誌論文] 線条体における行動価値と行動選択のメカニズム2006

    • 著者名/発表者名
      鮫島 和行
    • 雑誌名

      試験医学 24・15

      ページ: 2326-2333

URL: 

公開日: 2008-05-08   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi