2021 Fiscal Year Annual Research Report

超高次元機械学習モデルの学習ダイナミクスの究明と効率的学習法の開発

Research Project

Project/Area Number	19K20337
Research Institution	Kyushu Institute of Technology
Principal Investigator	二反田篤史九州工業大学, 大学院情報工学研究院, 准教授 (60838811)
Project Period (FY)	2019-04-01 – 2022-03-31
Keywords	確率的最適化法 / ニューラルネットワーク / 深層学習 / 機械学習 / 平均場理論
Outline of Annual Research Achievements	ニューラルネットワークの学習は非線形最適化問題に帰着するにも関わらず最適解へ収束することが経験的に知られている．本研究ではその理由を解明すべく過剰パラメトリゼーションのもとでの最適化ダイナミクスの解析を進めた．特にニューラルネットワークの平均場理論に基づく結果を得た．この理論は自身が提案したものであり，本年度の研究でさらに深化させることに成功した．平均場ニューラルネットワークは表現学習という重要な特徴を備えたモデルであるが最適化は容易ではないと考えられていた．本年度の研究では負エントロピー項を正則化として加えると効率的に最適化が可能であることを有限次元の凸最適化理論を無限次元の設定に拡張することで証明した．これは有限サイズの平均場ニューラルネットワークが多項式時間で学習できることを示した初の研究成果である．さらに標準的な最適化法であるノイズ付き勾配降下法に対しても新しい理論解析方針を与えた．この理論はランジュバンモンテカルロ法に対する収束理論を非線形の問題に拡張したものであり，今後さらなる発展が期待される．以上の成果はいずれもトップ国際会議であるNeurIPSおよびAISTATSに採択された．またこれらの研究と並行してミニバッチ確率的勾配降下法の理論限界に関する研究や深層学習モデルがその高い適応性によってカーネル法を優越することを示す研究にも取り組みそれぞれKAIS，NeurIPSに採択された．

Research Products
(14 results)

All 2022 2021

All Journal Article (4 results) (of which Int'l Joint Research: 2 results, Peer Reviewed: 4 results, Open Access: 3 results) Presentation (10 results) (of which Int'l Joint Research: 6 results, Invited: 2 results)

[Journal Article] Convex Analysis of the Mean Field Langevin Dynamics2022
- Author(s)
  Atsushi Nitanda, Denny Wu, Taiji Suzuki
- Journal Title
  
  Proceedings of Machine Learning Research (AISTATS2022)
  
  Volume: 151 Pages: 9741-9757
- Peer Reviewed / Open Access / Int'l Joint Research
[Journal Article] Sharp characterization of optimal minibatch size for stochastic finite sum convex optimization2021
- Author(s)
  Nitanda Atsushi, Murata Tomoya, Suzuki Taiji
- Journal Title
  
  Knowledge and Information Systems
  
  Volume: 63 Pages: 2513-2539
- DOI
  10.1007/s10115-021-01593-1
- Peer Reviewed
[Journal Article] Deep learning is adaptive to intrinsic dimensionality of model smoothness in anisotropic Besov space2021
- Author(s)
  Taiji Suzuki, Atsushi Nitanda
- Journal Title
  
  Advances in Neural Information Processing Systems (NeurIPS2021)
  
  Volume: 34 Pages: 3609-3621
- Peer Reviewed / Open Access
[Journal Article] Particle Dual Averaging: Optimization of Mean Field Neural Networks with Global Convergence Rate Analysis2021
- Author(s)
  Atsushi Nitanda, Denny Wu, Taiji Suzuki
- Journal Title
  
  Advances in Neural Information Processing Systems (NeurIPS2021)
  
  Volume: 34 Pages: 19608-19621
- Peer Reviewed / Open Access / Int'l Joint Research
[Presentation] Convex Analysis of the Mean Field Langevin Dynamics2022
- Author(s)
  Atsushi Nitanda
- Organizer
  Workshop on Functional Inference and Machine Intelligence
- Int'l Joint Research / Invited
[Presentation] Deep learning is adaptive to intrinsic dimensionality of model smoothness in anisotropic Besov space2021
- Author(s)
  Taiji Suzuki, Atsushi Nitanda
- Organizer
  Neural Information Processing Systems (NeurIPS2021)
- Int'l Joint Research
[Presentation] Particle Dual Averaging: Optimization of Mean Field Neural Networks with Global Convergence Rate Analysis2021
- Author(s)
  Atsushi Nitanda, Denny Wu, Taiji Suzuki
- Organizer
  Neural Information Processing Systems (NeurIPS2021)
- Int'l Joint Research
[Presentation] Convex Analysis of the Mean Field Langevin Dynamics2021
- Author(s)
  Atsushi Nitanda, Denny Wu, Taiji Suzuki
- Organizer
  International Conference on Artificial Intelligence and Statistics (AISTATS2022)
- Int'l Joint Research
[Presentation] 平均場ニューラルネットワークの最適化法2021
- Author(s)
  二反田篤史
- Organizer
  日本オペレーションズ・リサーチ学会九州支部 2021年度第1回講演会・研究会
- Invited
[Presentation] Optimality and superiority of deep learning for estimating functions in variants of Besov spaces2021
- Author(s)
  Taiji Suzuki, Atsushi Nitanda, Kazuma Tsuji
- Organizer
  International Conference on Econometrics and Statistics (EcoSta)
- Int'l Joint Research
[Presentation] Fast learning rates of averaged stochastic gradient descent for over-parameterized neural networks2021
- Author(s)
  Atsushi Nitanda, Taiji Suzuki
- Organizer
  International Conference on Econometrics and Statistics (EcoSta)
- Int'l Joint Research
[Presentation] 平均場ニューラルネットワークの収束率保証付き最適化2021
- Author(s)
  二反田篤史
- Organizer
  日本応用数理学会年会
[Presentation] 平均場ニューラルネットワークの効率的最適化法2021
- Author(s)
  二反田篤史，大古一聡，Denny Wu，鈴木大慈
- Organizer
  統計関連学会連合大会
[Presentation] Particle Stochastic Dual Coordinate Ascent: Exponential Convergent Algorithm for Mean Field Neural Network Optimization2021
- Author(s)
  大古一聡, 鈴木大慈, 二反田篤史, Denny Wu.
- Organizer
  情報論的学習理論ワークショップ (IBIS)

2021 Fiscal Year Annual Research Report

超高次元機械学習モデルの学習ダイナミクスの究明と効率的学習法の開発

Principal Investigator

二反田 篤史 九州工業大学, 大学院情報工学研究院, 准教授 (60838811)

Research Products

[Journal Article] Convex Analysis of the Mean Field Langevin Dynamics2022

Author(s)

Journal Title

[Journal Article] Sharp characterization of optimal minibatch size for stochastic finite sum convex optimization2021

Author(s)

Journal Title

DOI

[Journal Article] Deep learning is adaptive to intrinsic dimensionality of model smoothness in anisotropic Besov space2021

Author(s)

Journal Title

[Journal Article] Particle Dual Averaging: Optimization of Mean Field Neural Networks with Global Convergence Rate Analysis2021

Author(s)

Journal Title

[Presentation] Convex Analysis of the Mean Field Langevin Dynamics2022

Author(s)

Organizer

[Presentation] Deep learning is adaptive to intrinsic dimensionality of model smoothness in anisotropic Besov space2021

Author(s)

Organizer

[Presentation] Particle Dual Averaging: Optimization of Mean Field Neural Networks with Global Convergence Rate Analysis2021

Author(s)

Organizer

[Presentation] Convex Analysis of the Mean Field Langevin Dynamics2021

Author(s)

Organizer

[Presentation] 平均場ニューラルネットワークの最適化法2021

Author(s)

Organizer

[Presentation] Optimality and superiority of deep learning for estimating functions in variants of Besov spaces2021

Author(s)

Organizer

[Presentation] Fast learning rates of averaged stochastic gradient descent for over-parameterized neural networks2021

Author(s)

Organizer

[Presentation] 平均場ニューラルネットワークの収束率保証付き最適化2021

Author(s)

Organizer

[Presentation] 平均場ニューラルネットワークの効率的最適化法2021

Author(s)

Organizer

[Presentation] Particle Stochastic Dual Coordinate Ascent: Exponential Convergent Algorithm for Mean Field Neural Network Optimization2021

Author(s)

Organizer

二反田篤史九州工業大学, 大学院情報工学研究院, 准教授 (60838811)