研究課題
[目的]報酬に基づく強化学習の神経生理学的研究は、自律的に行動するロボットの開発、教育への応用などに強力なインパクトを与える。強化学習理論では予測される報酬と実際に得られた報酬の差(報酬予測誤差)の計算過程が実験的、理論的に最も重要な問題の一つである。報酬予測誤差をコードするとされるドパミン細胞にはアセチルコリン性細胞がある脚橋被蓋核(PPTN)とセロトニン細胞がある背側縫線核(DRN)の投射がある。これらが単一神経細胞レベルでどのような報酬情報を計算しているかを調べた。[方法]眼球運動課題を訓練したサルを用いて、PPTNおよびDRNの単一神経活動を記録した。この課題では眼球運動のターゲットは右か左であり、ターゲットの位置または中央の注視点の色が異なるジュースの量(報酬)と関連付けられている。さらに、嫌悪刺激への反応も古典的条件付け課題で調べた。[結果](1)PPTNのニューロン活動は「報酬の予測」、「実際に与えられた報酬」のどちらかの情報に関与することはすでに明らかにしたが、さらにニューロン活動記録から神経回路ダイナミクスを調べた。中脳の神経細胞が強化学習課題中の課題への動機付け、刺激による報酬予測などの課題の状況依存的に発火頻度のみならず、スパイクの時間間隔などの活動ダイナミクスを変化させることを見出した。(2)DRN細胞の半数は、時々刻々とアップデートされる期待されるまたは得られる報酬の絶対量をコードしていることがあきらかになった。さらにDRNの中には報酬に反応するものと嫌悪刺激に反応するものがあった。(3)神経疾患は神経伝達物質の機能異常によるものが多い。阪大医学系研究科との共同研究で、こどもの眼球運動をモニタし、比較的単純なサッケード分析から脳の病気(中脳などの異常)を見つけ出す(注意障害)ことに成功した。[考察]以上のことからPPTNおよびDRNからは異なる種類の報酬関連情報がドパミン細胞に提供され、報酬予測誤差の計算過程に寄与している可能性が示唆された。
すべて 2011 2010 その他
すべて 雑誌論文 (3件) (うち査読あり 3件) 学会発表 (9件) 図書 (1件) 備考 (2件)
Neuropsychopharmacology
巻: 36 ページ: 98-113
The Journal of Neuroscience
巻: 30(18) ページ: 6262-6272
Toxicologic Pathology
巻: 38(7) ページ: 1058-1063
http://www.kmu.ac.jp/depts/intro/physiol2.html
http://www7.bpe.es.osaka-u.ac.jp/~yasushi/gyoseki.htm