1995 Fiscal Year Annual Research Report
Project/Area Number |
07243205
|
Research Institution | The University of Electro-Communications |
Principal Investigator |
中村 清彦 電気通信大学, 大学院・情報システム学研究科, 助教授 (10172397)
|
Keywords | 強化学習 / 視床下部 / 運動野 / 神経回路 / 試行錯誤 / 報酬系 |
Research Abstract |
動物は試行錯誤によって未知の外界から報酬を得る方法を学習できる.この学習能力が実現されるためには次の2つの機能が必要である.(1)多様な試行を生成する機能.(2)試行の中から報酬に基づいて正しい行動を見出せる機能.本研究は,これらの機能がそれぞれ大脳皮質運動野-視床系と大脳新皮質-視床下部系の神経回路によって実現されているとする仮説を提示し,その妥当性を上記の系の神経回路モデルで検証した.まず,これらの系に関する神経生理学・解剖学データを収集しそれらに忠実な数理神経回路モデルを構築し,以下の結果を得た.(1)このモデルの計算機シミュレーションにより,運動系が生成可能な行動パタンのうちの90%以上を大脳皮質運動野-視床系の挙動が生成できることを示した.(2)上記の2つの系を統合した神経回路は試行錯誤の繰り返しによって感覚刺激に対応した報酬行動を採るようになることを上記の数理神経回路モデル上でいくつかの条件の下に解析的に証明した.(3)上記2つの系を統合した系の神経回路モデルのシミュレーションを行い証明結果を再現した.これはシミュレーションで用いた細胞数などの生理学解剖学データの基づく条件が(2)で導入した条件を満たしていることを示唆するものである.さらに,このシミュレーションは学習成立後の大脳皮質神経回路が数百ミリ秒で適切な行動を発現できる高速並列演算機構として働くことを示した.これらから,大脳新皮質-視床-視床下部系の神経回路が試行錯誤による学習機能を実現しているとする仮説の妥当性が示唆された.
|
Research Products
(2 results)