• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実績報告書

確率測度最適化法に基づく適応的機械学習アルゴリズムの研究

研究課題

研究課題/領域番号 22H03650
配分区分補助金
研究機関九州工業大学

研究代表者

二反田 篤史  九州工業大学, 大学院情報工学研究院, 准教授 (60838811)

研究期間 (年度) 2022-04-01 – 2026-03-31
キーワード平均場ニューラルネットワーク / 平均場最適化 / ニューラルネットワーク / 確率的最適化 / 非凸最適化
研究実績の概要

最適化による大域収束性を備えるモデルとして平均場ニューラルネットワークがある.このモデルは深層学習の成功要因と考えられる表現学習の性質を備えることから重要な研究対象になっている.同時にこのモデルの最適化理論は一般に困難であり,特に最適化効率を明らかにする収束率解析のためには強い仮定や正則化が必要と考えられていた.このような背景の中,学習問題を確率測度の空間上で定式化し最適化問題にカルバック・ライブラ距離を正則化として加えることでより自然に凸最適化理論が展開可能となることを本研究で示した.具体的には平均場ランジュバンダイナミクスの理論を構築することで,ニューロンが無数にある場合の平均場ニューラルネットワークに対するノイズ付き勾配降下法の大域的収束性とその収束率を示した.また問題の凸性を活かすことで従来の有限次元空間上の凸最適化理論を平均場ニューラルネットワークの解析に援用可能であることを示した.これにより有限のニューロン数のもとでも効率的な最適化が可能であることを示した.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究では次の3項目に取り組んでいる.研究1: 「平均場ニューラルネットワークの最適化理論の深化」,研究2: 「平均場ニューラルネットワークとNTK理論の統合研究」,研究3: 「深層学習の成功要因を抽出した適応的アルゴリズムの開発と応用展開」.本年度は平均場ニューラルネットワークの最も標準的な最適化手法であるノイズ付き勾配降下法に対する収束解析を平均場ランジュバンダイナミクスの解析を通じ与え,さらに効率的最適化手法の提案を従来の凸解析理論を援用することで実現した.これらは平均場ニューラルネットワークの最適化が多項式時間で可能であることを初めて保証する成果であり,研究1に大いに貢献するものである.

今後の研究の推進方策

次年度は研究1, 2, 3のすべてに取り組む計画である.研究1に関しては,本年度までの研究で得られた理論を活用しEntropic Fictitious Play(ゲーム理論で開発されたFictitious Playにエントロピー正則化を加味したアルゴリズム)の収束解析とその応用開拓に取り組む.さらに研究3に関しては,確率的最適化に対し大きなステップサイズがもたらすバイアス(損失関数の平坦な領域への収束性)を調べることで効率的学習法の研究を試みる.研究2に関しては,判別問題に対する平均場ニューラルネットワークの汎化性能解析に取り組む.具体的には判別問題で用いられる損失関数の指数的性質が最適化効率を向上させることを示し,それを平均場ニューラルネットワークの汎化性に関連付ける.NTK理論との統合という当初の計画とは異なるが,研究2の目標はこのアプローチによっても達成される.

  • 研究成果

    (13件)

すべて 2023 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (3件) (うち国際共著 3件、 査読あり 3件、 オープンアクセス 3件) 学会発表 (8件) (うち国際学会 6件) 図書 (1件)

  • [国際共同研究] トロント大学(カナダ)

    • 国名
      カナダ
    • 外国機関名
      トロント大学
  • [雑誌論文] Two-layer neural network on infinite dimensional data: global optimization guarantee in the mean-field regime2022

    • 著者名/発表者名
      Naoki Nishikawa, Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • 雑誌名

      Advances in Neural Information Processing Systems (NeurIPS2022)

      巻: 35 ページ: 32612-32623

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Particle dual averaging: optimization of mean field neural network with global convergence rate analysis*2022

    • 著者名/発表者名
      Nitanda Atsushi、Wu Denny、Suzuki Taiji
    • 雑誌名

      Journal of Statistical Mechanics: Theory and Experiment

      巻: 2022 ページ: 114010~114010

    • DOI

      10.1088/1742-5468/ac98a8

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Particle Stochastic Dual Coordinate Ascent: Exponential convergent algorithm for mean field neural network optimization2022

    • 著者名/発表者名
      Kazusato Oko, Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • 雑誌名

      The 10th International Conference on Learning Representations

      巻: 10 ページ: -

    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] Primal and Dual Analysis of Mean-field Models2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      EPFL-CIS & RIKEN AIP Joint Workshop on Machine Learning
    • 国際学会
  • [学会発表] Optimization Theory of Neural Networks under Mean-field Regime2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      Workshop on Optimization and Machine Learning
    • 国際学会
  • [学会発表] Primal and Dual Analysis of Mean-field Models2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      RIKEN-AIP & PRAIRIE Joint Workshop on Machine Learning and Artificial Intelligence
    • 国際学会
  • [学会発表] ニューラルネットワークの平均場解析2022

    • 著者名/発表者名
      二反田篤史
    • 学会等名
      IBISML研究会
  • [学会発表] 平均化確率的勾配降下法による平坦性を指向する帰納バイアスの強化2022

    • 著者名/発表者名
      菊池竜平,前田修吾,二反田篤史
    • 学会等名
      情報論的学習理論ワークショップ (IBIS)
  • [学会発表] Convex Analysis of the Mean Field Langevin Dynamics2022

    • 著者名/発表者名
      Atsushi Nitanda, Denny Wu, Taiji Suzuki
    • 学会等名
      Conference on the Mathematical Theory of Deep Neural Networks (DeepMath)
    • 国際学会
  • [学会発表] Convergence of mean field gradient Langevin dynamics for optimizing two-layer neural networks2022

    • 著者名/発表者名
      Taiji Suzuki, Atsushi Nitanda, Denny Wu, Kazusato Oko
    • 学会等名
      International Conference of the ERCIM WG on Computational and Methodological Statistics (CMStatistics 2022)
    • 国際学会
  • [学会発表] Parameter Averaging for SGD Stabilizes the Implicit Bias towards Flat Regions2022

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      First A*STAR CFAR - RIKEN AIP Joint Workshop on AI and Machine Learning
    • 国際学会
  • [図書] 深層学習からマルチモーダル情報処理へ2022

    • 著者名/発表者名
      中山 英樹、二反田 篤史、田村 晃裕、井上 中順、牛久 祥孝
    • 総ページ数
      248
    • 出版者
      サイエンス社
    • ISBN
      9784781915548

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi