2018 Fiscal Year Annual Research Report
Elucidation of the Mathematical Basis and Neural Mechanisms of Multi-layer Representation Learning
Project Area | Correspondence and Fusion of Artificial Intelligence and Brain Science |
Project/Area Number |
16H06563
|
Research Institution | Okinawa Institute of Science and Technology Graduate University |
Principal Investigator |
銅谷 賢治 沖縄科学技術大学院大学, 神経計算ユニット, 教授 (80188846)
|
Project Period (FY) |
2016-06-30 – 2021-03-31
|
Keywords | ディープラーニング / 強化学習 / モジュール自己組織化 |
Outline of Annual Research Achievements |
1) 多階層表現学習の数理基盤:ディープラーニングを強化学習に用いる場合に、学習の安定性を保証しながらデータ効率を改善するConservative Value Iterationアルゴリズムの収束速度の数理解析とシミュレーション実験結果を、国際会議に投稿した。また、ディープラーニングをモデルベース強化学習に用いる場合の数理的な問題点を解析し、安定に効率よく学習するためのアルゴリズムTotal Propagation法を提案し、国際会議で発表した。 2) 多階層表現学習の神経機構:強化学習課題中のラットの神経活動計測データに対してタスクレベル、空間レベル、身体運動レベルの変数による回帰分析をさらに進め、前頭前野と線条体背内側部ではタスクイベントを表現するニューロンが、運動野と線条体背外側部には運動情報を表現するニューロンが多いことを明らかにした。うつ病患者と対照群の安静時fMRIを含む多種のデータに、新たに開発した教師なし学習手法を適用することにより、抗うつ薬の有効性に関わるうつ病のサブタイプを同定することに成功した。 3) 全脳レベルのモジュール自己組織化:大脳皮質の神経回路において、ボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムを明らかにするため、レバーの微小な動きを識別し操作する行動課題を実行中のマウス大脳皮質の異なる層の神経活動をプリズム内視鏡を用いて同時計測する実験を継続し、行動中の神経活動のイメージングを実現した。セロトニンニューロンの光遺伝学刺激による報酬待機行動の促進は、報酬の確実さ待機時間の不確かさに依存するという知見に対して、セロトニンが報酬獲得の事前確率を制御するという仮説に基づくベイズ意思決定モデルを提案し、シミュレーションにより実験データを再現することに成功した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
1) 多階層表現学習の数理基盤:学習の安定性を保ちつつデータ効率を上げる新たな強化学習アルゴリズムに関する論文を国際学会ICML2018, NeurIPS2018, AISTATS2019に投稿し、採択された。 2) 多階層表現学習の神経機構:教師なし学習によるうつ病サブタイプの同定について、Scientific Reports誌に論文発表を行った。 3) 全脳レベルのモジュール自己組織化:セロトニンが報酬獲得の事前確率を制御するというモデルに基づく論文を、Nature Communications誌に出版した。
|
Strategy for Future Research Activity |
1) 多階層表現学習の数理基盤:提案した新たな学習アルゴリズムが安定に効率よく動作することを、ロボット制御などの課題で実証する。 2) 多階層表現学習の神経機構:大脳皮質と大脳基底核の多階層情報表現に関する知見を論文として発表する。 3) 全脳レベルのモジュール自己組織化:大脳皮質でのボトムアップの感覚情報とトップダウンの予測情報が統合されるメカニズムについての光学神経活動計測実験をさらに進め、一次感覚野の各層の動的な情報表現の違いを明らかにする。
|