1995 Fiscal Year Annual Research Report

強化学習の脳内機構

Research Project

Project/Area Number	07243205
Research Institution	The University of Electro-Communications
Principal Investigator	中村清彦電気通信大学, 大学院・情報システム学研究科, 助教授 (10172397)
Keywords	強化学習 / 視床下部 / 運動野 / 神経回路 / 試行錯誤 / 報酬系
Research Abstract	動物は試行錯誤によって未知の外界から報酬を得る方法を学習できる.この学習能力が実現されるためには次の2つの機能が必要である.(1)多様な試行を生成する機能.(2)試行の中から報酬に基づいて正しい行動を見出せる機能.本研究は,これらの機能がそれぞれ大脳皮質運動野-視床系と大脳新皮質-視床下部系の神経回路によって実現されているとする仮説を提示し,その妥当性を上記の系の神経回路モデルで検証した.まず,これらの系に関する神経生理学・解剖学データを収集しそれらに忠実な数理神経回路モデルを構築し,以下の結果を得た.(1)このモデルの計算機シミュレーションにより,運動系が生成可能な行動パタンのうちの90%以上を大脳皮質運動野-視床系の挙動が生成できることを示した.(2)上記の2つの系を統合した神経回路は試行錯誤の繰り返しによって感覚刺激に対応した報酬行動を採るようになることを上記の数理神経回路モデル上でいくつかの条件の下に解析的に証明した.(3)上記2つの系を統合した系の神経回路モデルのシミュレーションを行い証明結果を再現した.これはシミュレーションで用いた細胞数などの生理学解剖学データの基づく条件が(2)で導入した条件を満たしていることを示唆するものである.さらに,このシミュレーションは学習成立後の大脳皮質神経回路が数百ミリ秒で適切な行動を発現できる高速並列演算機構として働くことを示した.これらから,大脳新皮質-視床-視床下部系の神経回路が試行錯誤による学習機能を実現しているとする仮説の妥当性が示唆された.

Research Products
(2 results)

All Publications (2 results)

[Publications] 中村清彦: "ストループ課題での色-語情報を数百ミリ秒で統合する皮質神経回路機構" 電子情報通信学会技術研究報告. NC94. 125-130 (1995)
[Publications] 橋戸忠久: "単位立方体により構成される物体における一般的視点の原理の検証" 電子情報通信学会技術研究報告. NC95. 37-42 (1995)