• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

確率測度最適化法に基づく適応的機械学習アルゴリズムの研究

研究課題

研究課題/領域番号 23K24906
補助金の研究課題番号 22H03650 (2022-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2022-2023)
応募区分一般
審査区分 小区分61030:知能情報学関連
研究機関九州工業大学

研究代表者

二反田 篤史  九州工業大学, 大学院情報工学研究院, 准教授 (60838811)

研究期間 (年度) 2022-04-01 – 2024-03-31
研究課題ステータス 中断 (2024年度)
配分額 *注記
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2026年度: 2,600千円 (直接経費: 2,000千円、間接経費: 600千円)
2025年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2024年度: 3,383千円 (直接経費: 2,602千円、間接経費: 780千円)
2023年度: 4,940千円 (直接経費: 3,800千円、間接経費: 1,140千円)
2022年度: 4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
キーワード平均場ニューラルネットワーク / 平均場最適化 / ニューラルネットワーク / 確率的最適化 / 非凸最適化 / 確率測度最適化 / 機械学習 / 深層学習 / 平均場理論
研究開始時の研究の概要

深層学習の登場によって人工知能技術の性能が飛躍的に向上している.その根幹技術がニューラルネットワークを用いた深層学習である.深層学習はそのポテンシャルの高さから学術・産業界における注目度が非常に高く活発に研究が進められている.一方で,その高い性能を引き出すためには多数の試行錯誤とそれに伴う膨大な計算リソースが必要とされる.その原因として深層学習の動作原理に対する理解不足からくる適切なネットワーク構造の決定・学習アルゴリズムのチューニングについての指針の欠如が挙げられる.本研究では深層学習を次世代技術としてさらに普及させるために深層学習の理論的理解に基づいた効率的学習法の開発に取り組む.

研究実績の概要

平均場ニューラルネットワークはデータへの高い適応性を持つモデルであるが同時に最適化が難しいモデルでもあり効率的な収束性の担保のためには強い条件が必要と考えられている.本研究では平均場ニューラルネットワークの学習問題が確率測度最適化問題に帰着することに着目し,確率測度空間上で適
当な正則化 (カルバック・ライブラ距離等) を加えることを考える.これにより確率測度空間上の凸最適化理論が展開可能となり,平均場ニューラルネットワークの効率的な学習可能性を示すことができる.
これまでの研究でニューロン数が無数にあるネットワークに対するノイズ付き勾配降下法の大域的最適化を示した.本年度はこの結果をより現実的な設定,すなわち有限個のニューロン数,離散時間,確率的勾配を使用という設定においても効率的に収束することを証明した.これはPropagation of Chaosの問題を部分的に解決する成果である.またこの性質を活かし特定の分類問題 (sparse parity問題)において平均場ニューラルネットワークに対するノイズ付き勾配降下法が汎化性能の意味でも優れた性能を備えることを証明した.更には平均場ニューラルネットワークの効率的な最適化法の開拓にも取り組んだ.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

深層学習モデルの最適化は非凸問題に帰着するにも関わらず,確率的勾配降下法などの勾配法ベースの手法は最適解に収束する.またその解の性質も様々で中には過学習を引き起こすものも存在する.それにも関わらず回避することが実験的に広く観測されている.この問題は深層学習の理論研究のコミュニティにおける共通課題であり,その解決に向けてニューラルタンジェントカーネル(NTK)やニューラルネットワークの平均場理論の研究が進んだ.本研究はとくにニューラルネットワークの平均場理論の進展に大いに寄与した.具体的にはNTK理論を精緻化し二層ニューラルネットワークを理論上最適な効率で学習可能な条件を与えた.平均場理論が対象とする平均場ニューラルネットワークはデータへの適応性に優れ,深層学習の成功要因である表現学習を体現するモデルであるが,収束性の解析は困難とされていた.そのような中,本研究では平均場ニューラルネットワークの最適化ダイナミクスに対する凸理論を活用し,代表的な平均場最適化法である平均場ランジュバンダイナミクスの解析理論や,その他,効率的最適化手法の開発に取り組んだ.

今後の研究の推進方策

優れた収束性を備えた平均場最適化手法のアプリケーションのを探索する.本分野における平均場理論は深層学習理論,とくにオーバーパラメトライズされた 2層ニューラル ネットワークの最適化ダイナミクスを分析するために開発されたが,潜在的に多くの応用が存在する.例えば,確率分布の空間上の最適化と捉えると,平均場ランジュバンダイナミクス (ノイズ付き勾配降下法) は,多くの機械学習分野への応用があり頻繁に使用されるランジュバンダイナミクスの拡張になっている.具体的には、エントロピー正則化の下では,平均場ランジュバンダイナミクスは凸汎関数を最小化し,ランジュバンダイナミクスは線形汎関数を最小化することに相当する.従って,多くの価値ある応用例の存在が期待される.例えば軌道推論,拡散モデルなどの平均場最適化法を開発する予定である.さらには大規模言語モデルなどを含む基盤モデルへの応用も視野にいれる.

報告書

(2件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 研究成果

    (22件)

すべて 2023 2022 その他

すべて 国際共同研究 (4件) 雑誌論文 (8件) (うち国際共著 8件、 査読あり 8件、 オープンアクセス 8件) 学会発表 (9件) (うち国際学会 7件、 招待講演 1件) 図書 (1件)

  • [国際共同研究] University of Toronto(カナダ)

    • 関連する報告書
      2023 実績報告書
  • [国際共同研究] King's College London/University of Greenwich(英国)

    • 関連する報告書
      2023 実績報告書
  • [国際共同研究] Duke Kunshan University(中国)

    • 関連する報告書
      2023 実績報告書
  • [国際共同研究] トロント大学(カナダ)

    • 関連する報告書
      2022 実績報告書
  • [雑誌論文] Uniform-in-time Propagation of Chaos for the Mean Field Gradient Langevin Dynamics2023

    • 著者名/発表者名
      Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • 雑誌名

      The 11th International Conference on Learning Representations (ICLR2023)

      巻: 11

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Primal and Dual Analysis of Entropic Fictitious Play for Finite-sum Problems2023

    • 著者名/発表者名
      Atsushi Nitanda, Kazusato Oko, Denny Wu, Nobuhito Takenouchi, Taiji Suzuki
    • 雑誌名

      The 40th International Conference on Machine Learning (ICML2023)

      巻: 202

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Tight and Fast Generalization Error Bound of Graph Embedding in Metric Space2023

    • 著者名/発表者名
      Atsushi Suzuki, Atsushi Nitanda, Taiji Suzuki, Jing Wang, Feng Tian, Kenji Yamanishi
    • 雑誌名

      The 40th International Conference on Machine Learning (ICML2023)

      巻: 202

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Convergence of Mean-field Langevin Dynamics: Time and Space Discretization, Stochastic Gradient, and Variance Reduction2023

    • 著者名/発表者名
      Taiji Suzuki, Denny Wu, Atsushi Nitanda
    • 雑誌名

      In Advances in Neural Information Processing Systems

      巻: 36

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Feature Learning via Mean-field Langevin Dynamics: Classifying Sparse Parities and Beyond2023

    • 著者名/発表者名
      Taiji Suzuki, Denny Wu, Kazusato Oko, Atsushi Nitanda
    • 雑誌名

      In Advances in Neural Information Processing Systems

      巻: 36

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Two-layer neural network on infinite dimensional data: global optimization guarantee in the mean-field regime2022

    • 著者名/発表者名
      Naoki Nishikawa, Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • 雑誌名

      Advances in Neural Information Processing Systems (NeurIPS2022)

      巻: 35 ページ: 32612-32623

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Particle dual averaging: optimization of mean field neural network with global convergence rate analysis*2022

    • 著者名/発表者名
      Nitanda Atsushi、Wu Denny、Suzuki Taiji
    • 雑誌名

      Journal of Statistical Mechanics: Theory and Experiment

      巻: 2022 号: 11 ページ: 114010-114010

    • DOI

      10.1088/1742-5468/ac98a8

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Particle Stochastic Dual Coordinate Ascent: Exponential convergent algorithm for mean field neural network optimization2022

    • 著者名/発表者名
      Kazusato Oko, Taiji Suzuki, Atsushi Nitanda, Denny Wu
    • 雑誌名

      The 10th International Conference on Learning Representations

      巻: 10

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] Convergence theory for mean-field optimization methods2023

    • 著者名/発表者名
      Atsushi Nitanda, Denny Wu, Taiji Suzuki
    • 学会等名
      Minisymposium: Recent advances on non-convex optimization in inverse problems, imaging and machine learning. International Council for Industrial and Applied Mathematics (ICIAM)
    • 関連する報告書
      2023 実績報告書
    • 国際学会 / 招待講演
  • [学会発表] Primal and Dual Analysis of Mean-field Models2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      EPFL-CIS & RIKEN AIP Joint Workshop on Machine Learning
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Optimization Theory of Neural Networks under Mean-field Regime2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      Workshop on Optimization and Machine Learning
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Primal and Dual Analysis of Mean-field Models2023

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      RIKEN-AIP & PRAIRIE Joint Workshop on Machine Learning and Artificial Intelligence
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] ニューラルネットワークの平均場解析2022

    • 著者名/発表者名
      二反田篤史
    • 学会等名
      IBISML研究会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 平均化確率的勾配降下法による平坦性を指向する帰納バイアスの強化2022

    • 著者名/発表者名
      菊池竜平,前田修吾,二反田篤史
    • 学会等名
      情報論的学習理論ワークショップ (IBIS)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Convex Analysis of the Mean Field Langevin Dynamics2022

    • 著者名/発表者名
      Atsushi Nitanda, Denny Wu, Taiji Suzuki
    • 学会等名
      Conference on the Mathematical Theory of Deep Neural Networks (DeepMath)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Convergence of mean field gradient Langevin dynamics for optimizing two-layer neural networks2022

    • 著者名/発表者名
      Taiji Suzuki, Atsushi Nitanda, Denny Wu, Kazusato Oko
    • 学会等名
      International Conference of the ERCIM WG on Computational and Methodological Statistics (CMStatistics 2022)
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [学会発表] Parameter Averaging for SGD Stabilizes the Implicit Bias towards Flat Regions2022

    • 著者名/発表者名
      Atsushi Nitanda
    • 学会等名
      First A*STAR CFAR - RIKEN AIP Joint Workshop on AI and Machine Learning
    • 関連する報告書
      2022 実績報告書
    • 国際学会
  • [図書] 深層学習からマルチモーダル情報処理へ2022

    • 著者名/発表者名
      中山 英樹、二反田 篤史、田村 晃裕、井上 中順、牛久 祥孝
    • 総ページ数
      248
    • 出版者
      サイエンス社
    • ISBN
      9784781915548
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi