• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

最適化と汎化を統合した深層学習理論の構築

研究課題

研究課題/領域番号 22KJ0903
補助金の研究課題番号 22J13388 (2022)
研究種目

特別研究員奨励費

配分区分基金 (2023)
補助金 (2022)
応募区分国内
審査区分 小区分60030:統計科学関連
研究機関東京大学

研究代表者

秋山 俊太  東京大学, 情報理工学系研究科, 特別研究員(DC2)

研究期間 (年度) 2023-03-08 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
1,700千円 (直接経費: 1,700千円)
2023年度: 800千円 (直接経費: 800千円)
2022年度: 900千円 (直接経費: 900千円)
キーワード深層学習理論の深化 / 特徴量学習 / 良性過学習 / 隠的正則化 / 深層学習の優位性 / 高次元統計の汎化理論
研究開始時の研究の概要

深層学習の理論解析は近年盛んに研究されている一方,十分に現実の深層学習の有効性を示すものとは言えない.深層学習の理論解析における2つの重要な側面として,勾配法が適切に収束するかという「最適化理論」と,将来の未知のデータに対しても正しく予測できるかという「汎化誤差理論」が挙げられる.本研究は現状独立に発達している部分が多いこの2 つを統合し,より現実的な状況下で深層学習の有効性を示す理論を展開することで,この問題解決に取り組むものである.

研究実績の概要

当該年度においては、研究課題である「正則化機構に着目した深層機械学習」に則し、(1)深層機械学習における特徴量学習と良性過学習の原理解明と、(2)線形ニューラルネットワークにおける確率的勾配降下法の隠的正則化に対する統一的な特徴付け、と言う二つのテーマに取り組んだ。
まず(1)では、教師生徒設定(ニューラルネットワークで別のニューラルネットワーク構造を学習する設定)におけるReLU活性化関数を持つ二層ニューラルネットワークの学習において、特に生徒(学習されるネットワーク)が非常に広い横幅を持つ状況に着目した。そして、二段階(ノイズつき+通常の勾配降下法)の勾配法により、横幅やサンプルサイズに対して多項式時間で特徴量学習が可能であることを理論的に示した。さらにその結果を応用し、ニューラルネットワークの良性過学習(データに完全にフィットしていても予測誤差が小さくなる現象)が起きる条件を理論的に導出した。
次に(2)では、線形活性化関数をもつ二層ニューラルネットワークにおいて、勾配にのるノイズが与える隠的正則化の影響を理論的に解析した。特に、一層目と二層目のパラメータへのノイズ間の共分散構造によって、全体を線形関数としてみた場合の正則化が特徴づけられることを理論的に導出した。さらにその結果を応用し、Ridge回帰を誘導するノイズ構造の導出や、SGDやSAMなどの実用的な確率的最適化手法によりもたらされる隠的正則化の特徴づけを与えた。

報告書

(2件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 研究成果

    (4件)

すべて 2023 2022

すべて 学会発表 (4件) (うち国際学会 2件)

  • [学会発表] Benign Overfitting of Two-Layer Neural Networks under Inputs with Intrinsic Dimensionality2023

    • 著者名/発表者名
      Shunta Akiyama, Kazusato Oko, Taiji Suzuki
    • 学会等名
      HiLD: High-dimensional Learning Dynamics Workshop
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 低次元構造を持つデータに対するニューラルネットワーク の良性過学習の解析2023

    • 著者名/発表者名
      秋山 俊太,大古 一聡,鈴木 大慈
    • 学会等名
      統計関連学会連合大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] Excess Risk of Two-Layer ReLU Neural Networks in Teacher-Student Settings and its Superiority to Kernel Methods2023

    • 著者名/発表者名
      Shunta Akiyama, Taiji Suzuki
    • 学会等名
      Eleventh International Conference on Learning Representations
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] 低次元構造を持つデータに対するニューラルネットワークの良性過学習の解析2022

    • 著者名/発表者名
      秋山 俊太,大古 一聡,鈴木 大慈
    • 学会等名
      IBIS2022
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2022-04-28   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi