Statistical Mechanical Informatics of Deep Neural Networks

Research Project

Project/Area Number	21K18146
Research Category	Grant-in-Aid for Challenging Research (Pioneering)
Allocation Type	Multi-year Fund
Review Section	Medium-sized Section 13:Condensed matter physics and related fields
Research Institution	Osaka University
Principal Investigator	吉野元大阪大学, サイバーメディアセンター, 准教授 (50335337)
Project Period (FY)	2021-07-09 – 2024-03-31
Project Status	Granted (Fiscal Year 2022)
Budget Amount *help	¥25,090,000 (Direct Cost: ¥19,300,000、Indirect Cost: ¥5,790,000) Fiscal Year 2023: ¥8,450,000 (Direct Cost: ¥6,500,000、Indirect Cost: ¥1,950,000) Fiscal Year 2022: ¥8,970,000 (Direct Cost: ¥6,900,000、Indirect Cost: ¥2,070,000) Fiscal Year 2021: ¥7,670,000 (Direct Cost: ¥5,900,000、Indirect Cost: ¥1,770,000)
Keywords	深層学習 / ニューラルネットワーク / 情報統計力学
Outline of Research at the Start	深層ニューラルネットワーク(DNN)による深層学習は、実用上大きな成功を収めているが、そのメカニズムは明らかになっておらず、未だにブラックボックスである。本研究では、ガラスなど強く乱れた系の物理学から派生した情報統計力学の理論手法によって、DNNによる深層学習のメカニズム解明を目指す。本研究では、まず、訓練データに適合した可能なDNNのデザインパターンの位相空間を考え、そこでの統計力学をレプリカ法によって展開する。またこの位相空間における学習ダイナミックスに関する動的平均場理論を構築し、解析する。さらにこれらの理論結果を、大規模数値シミュレーションによって検証する。
Outline of Annual Research Achievements	本年度は、深層ニューラルネットワークによる機械学習の統計力学的解析について、以下のような成果が得られた。研究成果は論文"Spatially heterogeneous learning by a deep student machine", Hajime Yoshino, プレプリント arXiv:2302.07419 としてまとめられ、現在投稿中である。 (1) 本研究の準備研究である　H. Yoshino, SciPost Physics Core 2.2 (2020) 005で示したレプリカ理論が「密結合」と呼ぶ極限で厳密になることを示した。　ここで、密結合とはパーセプトロンの入力の数をc、ネットワークの幅をNとしたとき、1 << c << Nとなるような極限である。この場合に、ネットワーク内で複数の層を経由して閉じる相互作用ループの寄与が無視でき、H. Yoshino(2020)で得られた自由エネルギーの表式が厳密になることを示した。 (2) 一方、現実の系ではこの「密結合」に対するループ補正が重要になる。一つは、現実のネットワークの幅Nが有限であることによる効果である。もう一つは、現実のデータがもつ「有限次元効果」である。この有限次元Dの効果をhidden manifold model(　S. Goldt et. al. 2020))を我々のモデルに組み込むことによって考察した。その結果、これも有限幅N効果と同様に、ループ補正をもたらすことがわかった。このことから、有限幅Nの効果と、有限次元Dの効果は同じように現れることが期待される。実際、このことを下記の数値シミュレーションによって確かめることができた。 (3)昨年度は全結合系のシミュレーションを行なったが、上述の密結合極限を念頭にcとNをパラメータとして教師-生徒シナリオに関する数値シミュレーションを行なった。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 上記の「密結合」は以前の研究H. Yoshino (2020)の時点では気がついていなかったことである。DNNの統計力学で、厳密に解ける模型が得られたことの意義は大きい。ここを起点に様々な今後の理論的展開の可能性が広がる。上述の通り、これに合わせて新たな数値シミュレーションも行い、有意な結果を得ることができた。また今回の論文(H. Yoshino, arXiv:2302.07419)では、以下のような重要な報告も行った。H. Yoshino (2020)では、教師-生徒シナリオにおいて重要な問題である「汎化性能」の評価がされていなかったがこれについてTishby et. al. (1989)の"one step entropy"の方法を用いて詳細な解析を行った結果を記述した。 over-parametrizationのためにネットワーク中央部に遊び(液体層)が残されるが、ネットワーク両端の「結晶」があるために汎化性能が維持されることが明らかになった。このことからネットワークの深さLをどんなに深くしてover-parametrizationの度合いを強め、液体領域を増やしても、汎化誤差はLに依存せず、パラメータ　alpha=M/N (Mは訓練データの数)のみに依存する値に収束することが予言される。これは一見かなり直感に反する現象であるが、実際に上記の数値シミュレーションによって確かめることができた。この教師-生徒シナリオの数値シミュレーションはH. Yoshino(2020)では行われていなかったもので、今回の論文で初めて報告するものである。
Strategy for Future Research Activity	昨年度に引き継き、教師-生徒シナリオに関してCavity法に基づく解析を行う。これにより、レプリカ理論、モンテカルロシミュレーションに加えて第3のアプローチが同じ問題に対して得られることになる。これによって複合的な視点が得られることの意義は大きい。また、新たな学習アルゴリズムとなる可能性もある。

Report

(3 results)

Research Products

(22 results)

All 2023 2022 2021 Other

All Int'l Joint Research (3 results) Journal Article (1 results) (of which Peer Reviewed: 1 results, Open Access: 1 results) Presentation (18 results) (of which Invited: 11 results)

[Int'l Joint Research] Ecole Normale Superieure(フランス)
- Related Report
  2022 Research-status Report
[Int'l Joint Research] Sapienza University di Roma(イタリア)
- Related Report
  2022 Research-status Report
[Int'l Joint Research] 中国科学院理論物理研究所(中国)
- Related Report
  2022 Research-status Report
[Journal Article] Anatomy of Deep Neural Networks―A Statistical Mechanics Approach2021
- Author(s)
  吉野元
- Journal Title
  
  Butsuri
  
  Volume: 76 Issue: 9 Pages: 589-594
- DOI
  10.11316/butsuri.76.9_589
- NAID
  130008084796
- ISSN
  0029-0181, 2423-8872
- Year and Date
  2021-09-05
- Related Report
  2021 Research-status Report
- Peer Reviewed / Open Access
[Presentation] Random energy model in a pure ferromagnet2023
- Author(s)
  Hajime Yoshino
- Organizer
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- Related Report
  2022 Research-status Report
- Invited
[Presentation] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023
- Author(s)
  Angelo Giorgio Cavaliere, Riki Nagasawa, Shuta Yokoi, Tomoyuki Obuchi and Hajime Yoshino
- Organizer
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- Related Report
  2022 Research-status Report
[Presentation] Spatial evolution of RSB in layered p-spin models2023
- Author(s)
  Yuki Rea Hamano and Hajime Yoshino
- Organizer
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- Related Report
  2022 Research-status Report
[Presentation] Analysis of point-to-set lengths by 1+d dim replicated liquid theory in large-d limit2023
- Author(s)
  Yukihiro Tomita and Hajime Yoshino
- Organizer
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- Related Report
  2022 Research-status Report
[Presentation] 深層ニューラルネットワークにおける隠れた多様体模型の解析2023
- Author(s)
  吉野元
- Organizer
  日本物理学会2023年度春季大会（オンライン開催)
- Related Report
  2022 Research-status Report
- Invited
[Presentation] Spatially Heteterogeneous Learning in a Deep Neural Network2023
- Author(s)
  Hajime Yoshino
- Organizer
  Towards a theory of artificial and biological neural networks, Les Houches, France.
- Related Report
  2022 Research-status Report
[Presentation] 深層パーセプトロン学習における熱平衡化2022
- Author(s)
  吉野元
- Organizer
  物性研究所スパコン共同利用・CCMS合同研究会「計算物質科学の新展開」(東大物性研究所）
- Related Report
  2022 Research-status Report
- Invited
[Presentation] 深層学習の統計力学とガラス的な濡れ転移2022
- Author(s)
  吉野元
- Organizer
  研究会「非平衡ソフトマター・アモルファス物質の物性解明への力学的自己組織化からの挑戦」（東大生産研究所)
- Related Report
  2022 Research-status Report
- Invited
[Presentation] Statistical Mechanics of a Deep Neural Network2022
- Author(s)
  Hajime Yoshino
- Organizer
  Forum de Physique Statistique a l’Ecole Normale Superieure, (ENS Paris).
- Related Report
  2022 Research-status Report
- Invited
[Presentation] Spatial heterogeneity in a deep student machine2022
- Author(s)
  Hajime Yoshino
- Organizer
  Jean-Philippe Bouchaud: a rare event? (Theatre de la Reine Blanche, Paris)
- Related Report
  2022 Research-status Report
- Invited
[Presentation] 深層ニューラルネットワークにおけるレプリカ対称性の破れ2022
- Author(s)
  吉野元
- Organizer
  日本物理学会シンポジウム「Parisi のスピングラス理論と複雑系研究の発展」(オンライン開催 )
- Related Report
  2022 Research-status Report
- Invited
[Presentation] 深層ニューラルネットワークの統計力学におけるガラスの物理2022
- Author(s)
  吉野元
- Organizer
  日本物理学会シンポジウム
- Related Report
  2021 Research-status Report
- Invited
[Presentation] 深層ニューラルネットワークの汎化に関するレプリカ理論2022
- Author(s)
  吉野元
- Organizer
  日本物理学会
- Related Report
  2021 Research-status Report
[Presentation] 深層ニューラルネットワークによる教師-生徒シナリオのシミュレーション2022
- Author(s)
  ジョンソクダム, 吉野元
- Organizer
  日本物理学会
- Related Report
  2021 Research-status Report
[Presentation] 深層パーセプトロンネットワークにおける学習の統計力学2021
- Author(s)
  吉野元
- Organizer
  情報数物研究会
- Related Report
  2021 Research-status Report
- Invited
[Presentation] Design space of a deep neural network - its spatial evolution and robustness2021
- Author(s)
  Hajime Yoshino
- Organizer
  Institute for Physics of Intelligence
- Related Report
  2021 Research-status Report
- Invited
[Presentation] 深層ニューラルネットワークにおけるレプリカ対称性の破れとその空間構造2021
- Author(s)
  吉野元
- Organizer
  Deep Learning and Physics 2021
- Related Report
  2021 Research-status Report
- Invited
[Presentation] 教師-生徒シナリオによる深層パーセプトロン学習の頑健性2021
- Author(s)
  吉野元
- Organizer
  日本物理学会
- Related Report
  2021 Research-status Report

Statistical Mechanical Informatics of Deep Neural Networks

Principal Investigator

吉野 元 大阪大学, サイバーメディアセンター, 准教授 (50335337)

¥25,090,000 (Direct Cost: ¥19,300,000、Indirect Cost: ¥5,790,000)

Current Status of Research Progress

Reason

Report

Research Products

[Int'l Joint Research] Ecole Normale Superieure(フランス)

Related Report

[Int'l Joint Research] Sapienza University di Roma(イタリア)

Related Report

[Int'l Joint Research] 中国科学院理論物理研究所(中国)

Related Report

[Journal Article] Anatomy of Deep Neural Networks―A Statistical Mechanics Approach2021

Author(s)

Journal Title

DOI

NAID

ISSN

Year and Date

Related Report

[Presentation] Random energy model in a pure ferromagnet2023

Author(s)

Organizer

Related Report

[Presentation] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023

Author(s)

Organizer

Related Report

[Presentation] Spatial evolution of RSB in layered p-spin models2023

Author(s)

Organizer

Related Report

[Presentation] Analysis of point-to-set lengths by 1+d dim replicated liquid theory in large-d limit2023

Author(s)

Organizer

Related Report

[Presentation] 深層ニューラルネットワークにおける隠れた多様体模型の解析2023

Author(s)

Organizer

Related Report

[Presentation] Spatially Heteterogeneous Learning in a Deep Neural Network2023

Author(s)

Organizer

Related Report

[Presentation] 深層パーセプトロン学習における熱平衡化2022

Author(s)

Organizer

Related Report

[Presentation] 深層学習の統計力学とガラス的な濡れ転移2022

Author(s)

Organizer

Related Report

[Presentation] Statistical Mechanics of a Deep Neural Network2022

Author(s)

Organizer

Related Report

[Presentation] Spatial heterogeneity in a deep student machine2022

Author(s)

Organizer

Related Report

[Presentation] 深層ニューラルネットワークにおけるレプリカ対称性の破れ2022

Author(s)

Organizer

Related Report

[Presentation] 深層ニューラルネットワークの統計力学におけるガラスの物理2022

Author(s)

Organizer

Related Report

[Presentation] 深層ニューラルネットワークの汎化に関するレプリカ理論2022

Author(s)

Organizer

Related Report

[Presentation] 深層ニューラルネットワークによる教師-生徒シナリオのシミュレーション2022

Author(s)

Organizer

Related Report

[Presentation] 深層パーセプトロンネットワークにおける学習の統計力学2021

Author(s)

吉野元大阪大学, サイバーメディアセンター, 准教授 (50335337)