2001 Fiscal Year Annual Research Report
Project/Area Number |
13210042
|
Research Institution | The University of Tokyo |
Principal Investigator |
渡辺 正峰 東京大学, 大学院・工学系研究科, 助教授 (50312989)
|
Keywords | テンポラルコーディング / 強化学習 / 順伝播 / 前頭前野 |
Research Abstract |
本研究課題では、発火率コーディングとテンポラルコーディングの間の中間的なコーディングと考えられる、数十msecオーダーの瞬間的発火率コーディングの枠組みで、前頭前野における選択的注意課題の理論モデルを構築した。具体的には、多層ニューラルネットワークのための生理学的に妥当な学習則として"forward propagating reinforcement learning"を提案し、その妥当性を玉川大学坂上雅道先生らの選択的注意課題におけるサル前頭前野のニューロン活動を用いて検証した。 多層ニューラルネットワークを効率的に学習させる学習則として、中脳ドーパミンニューロンのシナプス修飾を基本とする強化学習があげられるが、多層ニューラルネットワークにうまく適用する方法はなく、全層同時に学習させようとすると学習が収束しないことが知られている。 そこで本研究では、構造的に二つの特徴を持たせたネットワークモデルを用いることにより、入力層から順に学習していくしくみを提案した。第一の特徴は、興奮性のフィードバック結合とともに抑制性のフィードバック結合を設けた点である。二つ目の特徴としては、最終層とは独立に出力ニューロンを設けて、中間層および最終層からの投射を仮定した点である。ここで出力層は前頭前野から運動系への投射先である補足運動野等に相当すると考えている。 以上の順伝播強化学習のメカニズムを用いることにより、多層のニューラルネットワークモデルの学習を生理学的に妥当な形で行うことができた。また、このような学習則が実際に脳の中で使われている可能性を検証するために、坂上らのサルのための選択的注意課題をモデルに解かせてみて、実際のサル前頭前野のニューロン活動との比較を行った結果、学習終了後のモデルの特徴は、中間層ニューロンの活動が立ち上がった後にすぐ活動が抑制されるのに対して、最終層のニューロンの方は活動が持続的であり、坂上らの実験データを解析した結果、同じような特徴が実際のサル前頭前野ニューロンにもみられた。
|
Research Products
(5 results)
-
[Publications] 渡辺正峰, 中西幸作, 合原一幸: "Solving the binding problem of the brain with bi-directional functional connectivity"Neural Networks. 14. 395-406 (2001)
-
[Publications] 高井聡, 渡辺秀典, 渡辺正峰: "学習前後におけるCA3-CA1問の発火活動の変化による記憶パターンの選択的消去"電子情報通信学会信学技報. 101-153. 21-25 (2001)
-
[Publications] 浦久保秀俊, 渡辺正峰: "ラット第5層IBモデルニューロンにおけるスパイク入力頻度に依存した応答発火特性の機能変化"電子情報通信学会信学技報. 101-238. 33-39 (2001)
-
[Publications] 渡辺正峰, 合原一幸: "Forward propagating reinforcement learning inspired by neuronal activity in monkey prefrontal cortex"Proc. of 2001 International Symposium on Nonlinear Theory and its Applications. 2. 581-583 (2001)
-
[Publications] 渡辺正峰, 合原一幸: "脳の高次機能"朝倉書店. 302 (2001)