研究概要 |
単にニューラルネットを用いて強化学習を行なうだけで,シンボルの発現,記憶の学習,状態や行動の抽象化といった高次と呼べる機能が,トイプロブレムにおいて発現することがわかってきた。そこで,本研究では,ニューラルネットを用いた強化学習のアプローチによって,『高次機能の創発』がどこまで説明できるのかに挑戦していく。具体的には (1)離散状態間遷移の学習とシンボル・論理的思考 (2)空間情報の抽象化と予測・概念形成 (3)決定論的知的探索と時間的抽象化・好奇心の3つに焦点を当て,視覚センサ信号等を入力とし、リカレントニューラルネットで出力を決定する移動ロボットを、複数の部屋からなる環境において報酬や罰を元に学習させることで,上記の高次機能が創発してくることをわかりやすくアピールしていく
|