• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

Intensifying deep learning theory and its application to structure analysis of deep neural network

Research Project

Project/Area Number 18H03201
Research InstitutionThe University of Tokyo

Principal Investigator

鈴木 大慈  東京大学, 大学院情報理工学系研究科, 准教授 (60551372)

Project Period (FY) 2018-04-01 – 2022-03-31
Keywords機械学習 / 統計的学習理論 / 深層学習
Outline of Annual Research Achievements

・深層学習の汎化性能を理解するために,以下の三つの成果を出した.(1)Besov空間におけるReLU型深層ニューラルネットワークの適応力:機械学習では様々な形状の関数をデータから推定する必要がある.実は,深層学習はこの関数の形状に関して高い適応力を持っていることが示され,それによってカーネル法などの他手法と比べて高い推定精度を達成できることを示した.そのため,対象となる関数クラスとしてBesov空間を考え,スパース推定や関数近似理論を用いて深層学習の優位性を示した.(2)深層学習のモデル圧縮とその理論:深層学習はデータサイズに比べて大きなパラメータ数でも汎化することが知られている.その一つの理由として,ネットワークが圧縮できるからであるという知見がある.昨年度から引き続きこの方向性で深層学習の性質を調べ,圧縮方法の改良およびドメイン適合・プレトレイニングモデルの圧縮などに応用した.(3)深層学習の構造を自動的に構築するためのResNet型の学習方法も提案している.これは,ResNetを一層積み上げることが関数空間における勾配降下法の一反復とみなすことで実現可能な新しいブースティング手法である.
・確率的最適化の研究に関して,データの一部しか情報が得られない状況におけるオンラインスパース推定方法を提案した.例えば,病院における患者のデータは,各患者ごとにすべての項目についてデータが得られるわけではなく,あくまで一部しか観測できない.そのような状況においても正しいデータ解析を行えるように,データが逐次的に観測されるオンライン学習の状況で,真の回帰モデルがスパースな状況で,データがすべて観測できる状況とほぼ同じの最適な収束レートが達成できることが示された.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

深層学習のモデル圧縮理論は昨年度より洗練され,いくつかの応用に発展している.また,Besov空間における推定理論を打ち立てることで,深層学習が本質的に「どう良いのか」という重要な疑問に一つの回答を与えたものと考えている.
さらに,確率的最適化やその関数空間での最適化といった手法も開発しており,おおむね順調に進展していると考えている.

Strategy for Future Research Activity

Besov空間での推定理論をさらに推し進め,古典的な関数空間とは異なる状況でどれだけ深層学習が他手法より優れていると言えるかを調べる.そのため,特に関数空間の非凸性に着目し,深層学習の良さに関する特徴付けを明確にする.
深層ニューラルネットワークの圧縮手法をさらに拡張し,様々なモデル探索手法に適用する.特にResNet型のモデル構築手法の研究で得た知見も援用しながら,ResNet型でないネットワークに対しても適用可能な手法を模索する.
深層学習の良さを定量的に評価するため,単純な全結合型ニューラルネットだけでなく,CNNやグラフCNNといったモデルも考察する.
確率的最適化の研究に関しては,判別問題において,判別が簡単な状況において従来よりより速い収束を示し,また,その拡張としてカーネルの低ランク近似を行う手法などを考察する.また,深層学習のような非凸最適化問題において,効率的な確率的最適化手法を提案する.非凸最適化問題においては,局所最適解の問題が生じるが,それをうまく回避する手法を提案する.

  • Research Products

    (41 results)

All 2019 2018 Other

All Journal Article (17 results) (of which Peer Reviewed: 9 results,  Open Access: 14 results) Presentation (22 results) (of which Int'l Joint Research: 8 results,  Invited: 14 results) Remarks (1 results) Patent(Industrial Property Rights) (1 results) (of which Overseas: 1 results)

  • [Journal Article] 統計的学習理論とその深層学習への応用2019

    • Author(s)
      鈴木 大慈
    • Journal Title

      応用数理

      Volume: 28 Pages: 28~33

    • DOI

      https://doi.org/10.11540/bjsiam.28.4_28

    • Open Access
  • [Journal Article] Fast learning rate of non-sparse multiple kernel learning and optimal regularization strategies2018

    • Author(s)
      Suzuki Taiji
    • Journal Title

      Electronic Journal of Statistics

      Volume: 12 Pages: 2141~2192

    • DOI

      doi:10.1214/18-EJS1399

    • Peer Reviewed / Open Access
  • [Journal Article] Generalized ridge estimator and model selection criteria in multivariate linear regression2018

    • Author(s)
      Mori Yuichi、Suzuki Taiji
    • Journal Title

      Journal of Multivariate Analysis

      Volume: 165 Pages: 243~261

    • DOI

      https://doi.org/10.1016/j.jmva.2017.12.006

    • Peer Reviewed / Open Access
  • [Journal Article] Fast generalization error bound of deep learning from a kernel perspective2018

    • Author(s)
      Taiji Suzuki
    • Journal Title

      Proceedings of Machine Learning Research (AISTATS2018)

      Volume: 84 Pages: 1397--1406

    • Peer Reviewed / Open Access
  • [Journal Article] Independently Interpretable Lasso: A New Regularizer for Sparse Regression with Uncorrelated Variables2018

    • Author(s)
      Masaaki Takada, Taiji Suzuki, and Hironori Fujisawa
    • Journal Title

      Proceedings of Machine Learning Research (AISTATS2018)

      Volume: 84 Pages: 1008--1016

    • Peer Reviewed / Open Access
  • [Journal Article] Gradient Layer: Enhancing the Convergence of Adversarial Training for Generative Models2018

    • Author(s)
      Atsushi Nitanda and Taiji Suzuki
    • Journal Title

      Proceedings of Machine Learning Research (AISTATS2018)

      Volume: 84 Pages: 454--463

    • Peer Reviewed / Open Access
  • [Journal Article] Functional Gradient Boosting based on Residual Network Perception2018

    • Author(s)
      Atsushi Nitanda and Taiji Suzuki
    • Journal Title

      Proceedings of Machine Learning Research (ICML2018)

      Volume: 80 Pages: 3819--3828

    • Peer Reviewed / Open Access
  • [Journal Article] Adam Induces Implicit Weight Sparsity in Rectifier Neural Networks2018

    • Author(s)
      Yaguchi Atsushi、Suzuki Taiji、Asano Wataru、Nitta Shuhei、Sakata Yukinobu、Tanizawa Akiyuki
    • Journal Title

      IEEE International Conference on Machine Learning and Applications (ICMLA)

      Volume: 17 Pages: 17--20

    • Peer Reviewed / Open Access
  • [Journal Article] Sample Efficient Stochastic Gradient Iterative Hard Thresholding Method for Stochastic Sparse Linear Regression with Limited Attribute Observation2018

    • Author(s)
      Tomoya Murata, and Taiji Suzuki
    • Journal Title

      Advances in Neural Information Processing Systems

      Volume: 31 Pages: 5312--5321

    • Peer Reviewed / Open Access
  • [Journal Article] Short-term local weather forecast using dense weather station by deep neural network2018

    • Author(s)
      Yonekura Kazuo、Hattori Hitoshi、Suzuki Taiji
    • Journal Title

      2018 IEEE International Conference on Big Data (Big Data)

      Volume: 1 Pages: 10--13

    • DOI

      DOI: 10.1109/BigData.2018.8622195

    • Peer Reviewed / Open Access
  • [Journal Article] 機械学習における確率的最適化2018

    • Author(s)
      鈴木 大慈
    • Journal Title

      応用数理

      Volume: 28 Pages: 27~33

    • DOI

      https://doi.org/10.11540/bjsiam.28.3_27

    • Open Access
  • [Journal Article] 過学習と正則化2018

    • Author(s)
      鈴木 大慈
    • Journal Title

      応用数理

      Volume: 28 Pages: 28~33

    • DOI

      https://doi.org/10.11540/bjsiam.28.2_28

    • Open Access
  • [Journal Article] 機械学習の概要2018

    • Author(s)
      鈴木 大慈
    • Journal Title

      応用数理

      Volume: 28 Pages: 32~37

    • DOI

      https://doi.org/10.11540/bjsiam.28.1_32

    • Open Access
  • [Journal Article] 数理のクロスロード/機械学習の数理/(2) カーネル法とニューラルネットワーク2018

    • Author(s)
      鈴木大慈
    • Journal Title

      数学セミナー

      Volume: 686 Pages: 68--73

  • [Journal Article] 数理のクロスロード/機械学習の数理/(1) 深層学習の理論2018

    • Author(s)
      鈴木大慈
    • Journal Title

      数学セミナー

      Volume: 685 Pages: 66--71

  • [Journal Article] 再生核ヒルベルト空間の理論によるガウス過程回帰の汎化誤差解析2018

    • Author(s)
      鈴木 大慈
    • Journal Title

      システム/制御/情報

      Volume: 62 Pages: 396~404

    • DOI

      https://doi.org/10.11509/isciesci.62.10_396

    • Open Access
  • [Journal Article] 「機械学習と数理統計」~統計的学習理論を通じて~2018

    • Author(s)
      鈴木大慈
    • Journal Title

      数理科学

      Volume: 662 Pages: 20--25

  • [Presentation] 深層ニューラルネットワークの汎化誤差とそのスパース推定との接点2019

    • Author(s)
      鈴木大慈
    • Organizer
      応用統計ワークショップ
    • Invited
  • [Presentation] Adaptivity of deep ReLU network and its generalization error analysis2019

    • Author(s)
      Taiji Suzuki
    • Organizer
      The Second Korea-Japan Machine Learning Workshop
    • Int'l Joint Research / Invited
  • [Presentation] Compressing deep neural network and its generalization error analysis via kernel theory2019

    • Author(s)
      Taiji Suzuki
    • Organizer
      Reinforcement Learning & Biological Intelligence, learning from biology, learning for biology
    • Int'l Joint Research / Invited
  • [Presentation] Besov空間における深層学習の汎化誤差解析およびモデル解析への応用2019

    • Author(s)
      鈴木大慈
    • Organizer
      愛媛大学理学部理学科数学・数理情報コース数学談話会
    • Invited
  • [Presentation] 深層ニューラルネットワークの適応能力と汎化誤差解析2019

    • Author(s)
      鈴木大慈
    • Organizer
      AIMaPワークショップ「非ノイマン型計算、理論と応用」
    • Invited
  • [Presentation] Generalization error of deep learning with connection to sparse estimation in function space2019

    • Author(s)
      Taiji Suzuki
    • Organizer
      Workshop on Functional Inference and Machine Intelligence
    • Int'l Joint Research / Invited
  • [Presentation] Generalization Error and Compressibility of Deep Learning via Kernel Analysis2018

    • Author(s)
      Taiji Suzuki
    • Organizer
      Tokyo Deep Learning Workshop (Deep Learning: Theory, Algorithms, and Applications)
    • Int'l Joint Research / Invited
  • [Presentation] 統計・機械学習における確率的最適化2018

    • Author(s)
      鈴木大慈
    • Organizer
      統計数理研究所公開講座
    • Invited
  • [Presentation] 深層学習の統計的学習理論:カーネル法とウェーブレット解析による視点2018

    • Author(s)
      鈴木大慈
    • Organizer
      第3回統計・機械学習若手シンポジウム「統計・機械学習の交わりと拡がり」
    • Invited
  • [Presentation] 機械学習における構造を利用した確率的最適化技法2018

    • Author(s)
      鈴木大慈
    • Organizer
      2018年電子情報通信学会基礎・境界ソサイエティ大会大会
    • Invited
  • [Presentation] 深層学習の汎化誤差理論とそのモデル解析への応用2018

    • Author(s)
      鈴木大慈
    • Organizer
      2018年日本数学会秋季総合分科会
    • Invited
  • [Presentation] 機械学習の現状と深層学習の数理2018

    • Author(s)
      鈴木大慈
    • Organizer
      山形大学データサイエンス推進室キックオフミーティング
    • Invited
  • [Presentation] Adaptivity of Deep ReLU Network for Learning in Besov Spaces2018

    • Author(s)
      Taiji Suzuki
    • Organizer
      Forum "Math-for-Industry" 2018 - Big Data Analysis, AI, Fintech, Math in Finances and Economics -
    • Int'l Joint Research / Invited
  • [Presentation] 深層学習のカーネル法による汎化誤差解析とその適応能力の評価2018

    • Author(s)
      鈴木大慈
    • Organizer
      京都大学数学教室・数理解析研究所談話会
    • Invited
  • [Presentation] 強低ノイズ条件下識別問題に対する確率的勾配降下法の線形収束性2018

    • Author(s)
      二反田 篤史,鈴木 大慈
    • Organizer
      IBIS2018
  • [Presentation] 確率的勾配降下法による期待識別誤差の線形収束性2018

    • Author(s)
      二反田 篤史,鈴木 大慈
    • Organizer
      統計関連学会連合大会
  • [Presentation] Generalization error analysis of deep learning: avoiding curse of dimensionality and practical application2018

    • Author(s)
      Taiji Suzuki
    • Organizer
      統計関連学会連合大会,2018 CSA-KSS-JSS Joint International Sessions: Machine Learning
    • Int'l Joint Research
  • [Presentation] 統計学と機械学習,そして人工知能2018

    • Author(s)
      鈴木 大慈
    • Organizer
      統計関連学会連合大会
  • [Presentation] Sparse Modeling with Uncorrelated Variables2018

    • Author(s)
      Masaaki Takada, Taiji Suzuki and Hironori Fujisawa
    • Organizer
      統計関連学会連合大会
  • [Presentation] Accelerated stochastic optimization for finite sum regularized empirical risk minimization2018

    • Author(s)
      Taiji Suzuki
    • Organizer
      First Conference on Discrete Optimization and Machine Learning
    • Int'l Joint Research
  • [Presentation] Estimating nonlinear tensor product in infinite dimensional functional space by kernel and neural network models2018

    • Author(s)
      Taiji Suzuki
    • Organizer
      IMS-APRM2018
    • Int'l Joint Research
  • [Presentation] 深層学習の汎化誤差理論とモデル圧縮への応用2018

    • Author(s)
      鈴木 大慈
    • Organizer
      「人工知能を用いた統合的ながん医療システムの開発」CRESTセミナー
  • [Remarks] http://ibis.t.u-tokyo.ac.jp/suzuki/

  • [Patent(Industrial Property Rights)] 気象予測システム、気象予測方法、および気象予測プログラム2018

    • Inventor(s)
      米倉一男,鈴木大慈
    • Industrial Property Rights Holder
      米倉一男,鈴木大慈
    • Industrial Property Rights Type
      特許
    • Industrial Property Number
      特願2018-227904
    • Overseas

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi