研究概要 |
脳の高次機能の典型は推論や言語といわれている.これらはいずれもシンボル処理と言われている.しかし脳におけるシンボル処理の実体および計算理論についてはほとんど判っていない. 我々はこの問題に対して脳における機能部品の組み合わせモデルを提唱し,本年度は計算機シミュレーションによるその実現と評価を試みた.例題としては地図世界のナビゲーションを使用した. シミュレーションでは,感覚入力,場所の認識,場所に対応した行動の記憶,その行動の生成,さらに各場所に対応した行動の探索的学習(強化学習)という個々の機能を実現する機能部品をニューラルネットによって構築し,その組合せを探索するメタ学習機構を可変長の遺伝的アルゴリズムを用いて実現した. 評価課題では,環境の地図の記憶を保持する能力を持たない学習エージェント(基礎エージェント)と環境地図を学習する機能部品を持つ学習エージェント(進化エージェント)を用意し,両者の学習結果を比較する実験を行なった.その結果,基礎エージェントは早期に最適と思われる行動を獲得するが,進化エージェントは持っている機能部品をフルに使用して環境のを学習して予測をするようになるには10世代程度が必要であることが判った. この結果より,予測という推論につながる機能を持つ学習動作もまた提案したモデルで獲得が可能てあることが示され,いわゆるシンボル的な行動もまた本モデルの枠内で説明できる可能性が出てきた.
|