研究課題/領域番号 |
13210042
|
研究種目 |
特定領域研究(C)
|
配分区分 | 補助金 |
審査区分 |
生物系
|
研究機関 | 東京大学 |
研究代表者 |
渡辺 正峰 東京大学, 大学院・工学系研究科, 助教授 (50312989)
|
研究期間 (年度) |
2001
|
研究課題ステータス |
完了 (2001年度)
|
配分額 *注記 |
3,600千円 (直接経費: 3,600千円)
2001年度: 3,600千円 (直接経費: 3,600千円)
|
キーワード | テンポラルコーディング / 強化学習 / 順伝播 / 前頭前野 |
研究概要 |
本研究課題では、発火率コーディングとテンポラルコーディングの間の中間的なコーディングと考えられる、数十msecオーダーの瞬間的発火率コーディングの枠組みで、前頭前野における選択的注意課題の理論モデルを構築した。具体的には、多層ニューラルネットワークのための生理学的に妥当な学習則として"forward propagating reinforcement learning"を提案し、その妥当性を玉川大学坂上雅道先生らの選択的注意課題におけるサル前頭前野のニューロン活動を用いて検証した。 多層ニューラルネットワークを効率的に学習させる学習則として、中脳ドーパミンニューロンのシナプス修飾を基本とする強化学習があげられるが、多層ニューラルネットワークにうまく適用する方法はなく、全層同時に学習させようとすると学習が収束しないことが知られている。 そこで本研究では、構造的に二つの特徴を持たせたネットワークモデルを用いることにより、入力層から順に学習していくしくみを提案した。第一の特徴は、興奮性のフィードバック結合とともに抑制性のフィードバック結合を設けた点である。二つ目の特徴としては、最終層とは独立に出力ニューロンを設けて、中間層および最終層からの投射を仮定した点である。ここで出力層は前頭前野から運動系への投射先である補足運動野等に相当すると考えている。 以上の順伝播強化学習のメカニズムを用いることにより、多層のニューラルネットワークモデルの学習を生理学的に妥当な形で行うことができた。また、このような学習則が実際に脳の中で使われている可能性を検証するために、坂上らのサルのための選択的注意課題をモデルに解かせてみて、実際のサル前頭前野のニューロン活動との比較を行った結果、学習終了後のモデルの特徴は、中間層ニューロンの活動が立ち上がった後にすぐ活動が抑制されるのに対して、最終層のニューロンの方は活動が持続的であり、坂上らの実験データを解析した結果、同じような特徴が実際のサル前頭前野ニューロンにもみられた。
|