2013 Fiscal Year Annual Research Report
大脳基底核のドーパミン依存性競合プロセスに基づく動的な状態空間分割モデルの提案
Project/Area Number |
24700200
|
Research Institution | National Defense Medical College |
Principal Investigator |
太田 宏之 防衛医科大学校(医学教育部医学科進学課程及び専門課程、動物実験施設、共同利用研究, 医学教育部医学科専門課程, 助教 (20535190)
|
Keywords | 強化学習 / 大脳基底核 / 線条体 |
Research Abstract |
大脳基底核線条体は作業記憶を必要とする学習の成立に関与することが知られており、その時空間的性質を解明し、その生理的実態に基づいて学習モデルを確立することが必要である。本研究ではラット大脳基底核線条体ニューロンの持続的発火の時間的性質、入力側から見た空間的性質、ドーパミン受容体依存性およびカルシウム動態依存性を明らかにし、これらの結果をもとにTemporal Difference誤差(TD誤差)の計算をネットワークに依存しない新たな強化学習モデルを提案した。 我々はWistar Thy1.2 promoter channelrhodopsin-2 Venus ratの線条体ニューロンに対して、青色光刺激を与えると光刺激終了後も発火を持続させ、刺激を繰り返すとその発火期間が徐々に延長する現象を見出した。一度時間発展した持続発火は、20秒の刺激休止期間を経ても残存した。成熟ラット線条体ニューロンのホールセルパッチクランプ実験より、この残存現象はゆっくりとした再分極過程に基づくものであることが示唆された。多点独立光刺激システムを構築し、大脳皮質-線条体スライスにおいて大脳皮質の特定領域を刺激して線条体の時間発展を誘導した際の他の領域に対する応答性を調べたところ、応答が亢進する場合があることがわかった。また持続発火の時間発展はドーパミンD1作動薬によって増強されること、及び特定のカルシウムチャネルに依存している事が明らかとなった。 これらの結果より個々の線条体ニューロンにおいてカルシウム依存性の20秒前後の持続的な状態保持機構が存在することが想定された。そこでこの状態保持機構を遅延報酬強化学習モデルにおける2つの短期的な記憶、すなわち適格度トレースと予測価値の時間差分(TD誤差)計算の生理的実態と仮定して、新たな強化学習モデルQTimerを提案した。
|
Research Products
(3 results)