• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2020 Fiscal Year Annual Research Report

深層学習の原理究明に向けた関数推定理論の開発

Research Project

Project/Area Number 18K18114
Research InstitutionThe University of Tokyo

Principal Investigator

今泉 允聡  東京大学, 大学院総合文化研究科, 准教授 (90814088)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords深層学習 / 関数推定 / ノンパラメトリック統計 / 汎化誤差
Outline of Annual Research Achievements

当該研究計画の概要は、深層学習の原理を説明することができる理論の構築である。深層学習は実用上で高い性能を発揮しているが、その原理は未解明の点が多く、この性能を説明できる理論は未だ発展途上である。本研究は、深層学習が未知の関数を推定する手法であるとみなした上で、深層学習の性能を記述できる理論の構築を行った。当該研究課題では、以下のような成果を得た。
1. データ生成関数の性質による深層学習の原理の記述:深層ニューラルネットワークで回帰の問題を解くときに、データを生成する真の関数がある性質を持つ場合は、深層学習の優位性が示されることを証明した。具体的には、真の関数が超曲面上の特異性を持つ場合や、入力データ生成分布が低くかつ特殊な固有次元を持つ場合に、深層学習が従来法よりも良い性質を持つことを証明した。これは理論的な性能の差別化の嚆矢となる研究で、いくつかの後継研究が生まれた。
2. 損失関数の形状による暗黙的正則化理論の開発:深層学習の複雑な非凸損失関数が、過学習を回避できることを示す理論を開発した。具体的には、母極小値という概念を開発し、そのもとでの汎化誤差の評価を行なった。近年批判されている深層学習アルゴリズムの暗黙的正則化仮説に対して、その批判に答えられる理論である。
3. 漸近リスクによる深層学習の性能評価:深層学習のパラメタ・標本極限の漸近リスクを導出し、深層学習モデルでも過剰パラメータ下での二重降下現象が起こることを示した。これは、線形モデルにしか扱えなかった二重降下を深層学習に応用した初めての例となった。
4. 効率的学習アルゴリズムの開発:深層学習の理論的な知見を用い、効率的に非凸最適化問題を解くアルゴリズムを開発した。具体的には、多層ニューラルネットワークの関数近似理論で作られたパラメータの実現値をアルゴリズム上で再現することで、効率的な解の発見を実現した。

  • Research Products

    (27 results)

All 2021 2020 Other

All Int'l Joint Research (5 results) Journal Article (3 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 3 results,  Open Access: 3 results) Presentation (17 results) (of which Int'l Joint Research: 5 results,  Invited: 14 results) Remarks (1 results) Funded Workshop (1 results)

  • [Int'l Joint Research] ラトガース大学/コーネル大学(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      ラトガース大学/コーネル大学
  • [Int'l Joint Research] インド工科大学(インド)

    • Country Name
      INDIA
    • Counterpart Institution
      インド工科大学
  • [Int'l Joint Research] マックスプランク研究所(ドイツ)

    • Country Name
      GERMANY
    • Counterpart Institution
      マックスプランク研究所
  • [Int'l Joint Research] ライデン大学(オランダ)

    • Country Name
      NETHERLANDS
    • Counterpart Institution
      ライデン大学
  • [Int'l Joint Research] ロンドン経済学校(英国)

    • Country Name
      UNITED KINGDOM
    • Counterpart Institution
      ロンドン経済学校
  • [Journal Article] 深層学習の原理解析:汎化誤差の側面から2021

    • Author(s)
      今泉允聡
    • Journal Title

      日本統計学会誌

      Volume: 50 Pages: 257-283

    • Peer Reviewed / Open Access
  • [Journal Article] On Random Subsampling of Gaussian Process Regression2020

    • Author(s)
      Kohei.Hayashi. Masaaki.Imaizumi. Yuichi Yoshida
    • Journal Title

      PMLR: Artificial Intelligence and Statistics

      Volume: 108 Pages: 2055-2065

    • Peer Reviewed / Open Access
  • [Journal Article] Adaptive Approximation and Generalization of Deep Neural Network with Intrinsic Dimensionality2020

    • Author(s)
      Ryumei Nakada. Masaaki Imaizumi
    • Journal Title

      Journal of Machine Learning Research

      Volume: 21 Pages: 1-38

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Presentation] Generalization Analysis of Deep Models with Loss Surface and Over Parameterization2021

    • Author(s)
      Masaaki Imaizumiツ?
    • Organizer
      Workshop on Functional Inference and Machine Intelligence
    • Int'l Joint Research / Invited
  • [Presentation] 深層学習の原理を明らかにする理論の試み2020

    • Author(s)
      今泉允聡
    • Organizer
      九大IMI特別セミナー
    • Invited
  • [Presentation] 深層学習の原理を明らかにする理論の試み2020

    • Author(s)
      今泉允聡
    • Organizer
      ビッグデータCREST合宿
    • Invited
  • [Presentation] Statistical Inference on M-estimators by High-dimensional Gaussian Approximation2020

    • Author(s)
      今泉允聡
    • Organizer
      東北大学データサイエンスセミナー
    • Invited
  • [Presentation] Generalization Analysis for Mechanism of Deep Learning2020

    • Author(s)
      Masaaki Imaizumi
    • Organizer
      Seoul National University Seminar
    • Int'l Joint Research / Invited
  • [Presentation] Statistical inference on M-estimators by high-dimensional Gaussian approximation2020

    • Author(s)
      Masaaki Imaizumiツ?
    • Organizer
      Workshop on Functional Inference and Machine Intelligence
    • Int'l Joint Research / Invited
  • [Presentation] 深層学習の原理を明らかにする理論の試み2020

    • Author(s)
      今泉允聡
    • Organizer
      大阪大学MMDS AI・データ利活用研究会
    • Invited
  • [Presentation] 深層学習の原理を明らかにする理論の試み2020

    • Author(s)
      今泉允聡
    • Organizer
      MLSE夏合宿
    • Invited
  • [Presentation] 深層学習の理論2020

    • Author(s)
      今泉允聡
    • Organizer
      東大松尾研
    • Invited
  • [Presentation] 深層学習の原理の理解に向けた理論の試み2020

    • Author(s)
      今泉允聡
    • Organizer
      諸科学における大規模データと統計数理モデリング
    • Invited
  • [Presentation] On Random Subsampling of Gaussian Process Regression2020

    • Author(s)
      K.Hayashi. M.Imaizumi. Y.Yoshida
    • Organizer
      Artificial Intelligence and Statistics
    • Int'l Joint Research
  • [Presentation] 大規模モデルの複雑性尺度と情報量規準2020

    • Author(s)
      今泉允聡
    • Organizer
      統計関連学会連合大会
  • [Presentation] 損失形状に基づく深層学習の汎化誤差解析2020

    • Author(s)
      今泉允聡
    • Organizer
      統計関連学会連合大会
  • [Presentation] 深層学習の発見からもたらされる基礎理論のパラダイム2020

    • Author(s)
      今泉允聡
    • Organizer
      東大情報理工コンピュータ専攻講演会
    • Invited
  • [Presentation] 損失関数の形状に基づく深層学習の汎化誤差解析2020

    • Author(s)
      今泉允聡
    • Organizer
      RAMP(OR学会分科会)
    • Invited
  • [Presentation] Theory of Deep Learning2020

    • Author(s)
      今泉允聡
    • Organizer
      奈良先端科学技術大学 データサイエンス特別講義
    • Invited
  • [Presentation] Fast Convergence on Perfect Classification for Functional Data2020

    • Author(s)
      Tomoya Wakayama. Masaaki Imaizumi
    • Organizer
      CM-Statistics
    • Int'l Joint Research / Invited
  • [Remarks] 深層学習によるデータ固有のフラクタル構造などへの適応を証明

    • URL

      https://www.u-tokyo.ac.jp/focus/ja/articles/z0508_00102.html

  • [Funded Workshop] Workshop on Functional Inference and Machine Intelligence2020

URL: 

Published: 2021-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi