研究領域 | 人工知能と脳科学の対照と融合 |
研究課題/領域番号 |
16H06563
|
研究機関 | 沖縄科学技術大学院大学 |
研究代表者 |
銅谷 賢治 沖縄科学技術大学院大学, 神経計算ユニット, 教授 (80188846)
|
研究期間 (年度) |
2016-06-30 – 2021-03-31
|
キーワード | ディープラーニング / 強化学習 / モジュール自己組織化 |
研究実績の概要 |
1) 多階層表現学習の数理基盤:ディープラーニングを強化学習に用いる場合に、学習の安定性を保証しながらデータ効率を改善するConservative Value Iterationアルゴリズムの収束速度の数理解析とシミュレーション実験結果を、国際会議に投稿した。また、ディープラーニングをモデルベース強化学習に用いる場合の数理的な問題点を解析し、安定に効率よく学習するためのアルゴリズムTotal Propagation法を提案し、国際会議で発表した。 2) 多階層表現学習の神経機構:強化学習課題中のラットの神経活動計測データに対してタスクレベル、空間レベル、身体運動レベルの変数による回帰分析をさらに進め、前頭前野と線条体背内側部ではタスクイベントを表現するニューロンが、運動野と線条体背外側部には運動情報を表現するニューロンが多いことを明らかにした。うつ病患者と対照群の安静時fMRIを含む多種のデータに、新たに開発した教師なし学習手法を適用することにより、抗うつ薬の有効性に関わるうつ病のサブタイプを同定することに成功した。 3) 全脳レベルのモジュール自己組織化:大脳皮質の神経回路において、ボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムを明らかにするため、レバーの微小な動きを識別し操作する行動課題を実行中のマウス大脳皮質の異なる層の神経活動をプリズム内視鏡を用いて同時計測する実験を継続し、行動中の神経活動のイメージングを実現した。セロトニンニューロンの光遺伝学刺激による報酬待機行動の促進は、報酬の確実さ待機時間の不確かさに依存するという知見に対して、セロトニンが報酬獲得の事前確率を制御するという仮説に基づくベイズ意思決定モデルを提案し、シミュレーションにより実験データを再現することに成功した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
1) 多階層表現学習の数理基盤:学習の安定性を保ちつつデータ効率を上げる新たな強化学習アルゴリズムに関する論文を国際学会ICML2018, NeurIPS2018, AISTATS2019に投稿し、採択された。 2) 多階層表現学習の神経機構:教師なし学習によるうつ病サブタイプの同定について、Scientific Reports誌に論文発表を行った。 3) 全脳レベルのモジュール自己組織化:セロトニンが報酬獲得の事前確率を制御するというモデルに基づく論文を、Nature Communications誌に出版した。
|
今後の研究の推進方策 |
1) 多階層表現学習の数理基盤:提案した新たな学習アルゴリズムが安定に効率よく動作することを、ロボット制御などの課題で実証する。 2) 多階層表現学習の神経機構:大脳皮質と大脳基底核の多階層情報表現に関する知見を論文として発表する。 3) 全脳レベルのモジュール自己組織化:大脳皮質でのボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムについての光学神経活動計測実験をさらに進め、一次感覚野の各層の動的な情報表現の違いを明らかにする。
|