研究領域 | 人工知能と脳科学の対照と融合 |
研究課題/領域番号 |
16H06563
|
研究機関 | 沖縄科学技術大学院大学 |
研究代表者 |
銅谷 賢治 沖縄科学技術大学院大学, 神経計算ユニット, 教授 (80188846)
|
研究期間 (年度) |
2016-06-30 – 2021-03-31
|
キーワード | ディープラーニング / 強化学習 / モジュール自己組織化 |
研究実績の概要 |
1) 多階層表現学習の数理基盤:ディープラーニングを強化学習に用いる場合に、学習の安定性を保証しながらデータ効率を改善するため、Conservative Value Iterationと呼ぶあらたな学習アルゴリズムを提案し、その収束速度の数理解析を行った。それをもとにサンプルノイズや近似誤差のもとで安定に効率良い探索と学習が可能なパラメタ設定をシミュレーション実験により明らかにした。 2) 多階層表現学習の神経機構:大脳基底核での情報表現の獲得機構を明らかにするため、線条体の異なるコンパートメントの細胞を区別した光学神経活動計測実験を行った結果、行動学習の進行にともないストライオソームの細胞が報酬予測的な応答を獲得することを明らかにし論文発表を行った。大脳皮質と大脳基底核の各領域の情報表現の違いを明らかにするため、強化学習課題中のラットの神経活動計測データに対してタスクレベル、空間レベル、身体運動レベルの変数による回帰分析を行い、多層的な情報表現の局在を解析した。 3) 全脳レベルのモジュール自己組織化:大脳皮質の神経回路において、ボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムを明らかにするため、マウスにレバーの微小な動きを識別させ操作を行わせる新たな行動課題を開発し、それを実行中のマウス大脳皮質の異なる層の神経活動をプリズム内視鏡を用いて同時計測する実験を開始した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1) 多階層表現学習の数理基盤:学習の安定性を保ちつつデータ効率を上げる新たな強化学習アルゴリズムについての国際学会論文の投稿を行った。 2) 多階層表現学習の神経機構:大脳基底核の線条体のストライオソームのニューロンが、報酬予測に関わる活動を示すという知見についてeNeuro誌に論文発表を行った。 3) 全脳レベルのモジュール自己組織化:マウスの新たな行動課題と光学神経活動記録システムが立ち上がり、計測実験を開始した。
|
今後の研究の推進方策 |
1) 多階層表現学習の数理基盤:提案した新たな学習アルゴリズムが、ディープネットワークとの組み合わせのもとで安定に効率よく動作することをAtariゲームなどの課題で実証する。 2) 多階層表現学習の神経機構:階層強化学習モデルにラットやマウスが行うのと同じ行動課題を学習させ、そこで獲得される情報表現を大脳皮質と大脳基底核の神経活動データと比較し解析を行う。 3)全脳レベルのモジュール自己組織化:大脳皮質でのボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムについての光学神経活動計測実験を進め、一次感覚野の各層の動的な情報表現の違いを明らかにする。
|