深層ニューラルネットワークの情報統計力学

研究課題

研究課題/領域番号	21K18146
研究種目	挑戦的研究(開拓)
配分区分	基金
審査区分	中区分13:物性物理学およびその関連分野
研究機関	大阪大学
研究代表者	吉野元大阪大学, サイバーメディアセンター, 教授 (50335337)
研究期間 (年度)	2021-07-09 – 2025-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	25,090千円 (直接経費: 19,300千円、間接経費: 5,790千円) 2023年度: 8,450千円 (直接経費: 6,500千円、間接経費: 1,950千円) 2022年度: 8,970千円 (直接経費: 6,900千円、間接経費: 2,070千円) 2021年度: 7,670千円 (直接経費: 5,900千円、間接経費: 1,770千円)
キーワード	深層学習 / ニューラルネットワーク / 情報統計力学
研究開始時の研究の概要	深層ニューラルネットワーク(DNN)による深層学習は、実用上大きな成功を収めているが、そのメカニズムは明らかになっておらず、未だにブラックボックスである。本研究では、ガラスなど強く乱れた系の物理学から派生した情報統計力学の理論手法によって、DNNによる深層学習のメカニズム解明を目指す。本研究では、まず、訓練データに適合した可能なDNNのデザインパターンの位相空間を考え、そこでの統計力学をレプリカ法によって展開する。またこの位相空間における学習ダイナミックスに関する動的平均場理論を構築し、解析する。さらにこれらの理論結果を、大規模数値シミュレーションによって検証する。
研究実績の概要	2023年度は、生徒-教師シナリオに基づいたDeep Neural Network(DNN)による学習をmessage passingによって行う方法の構築を行なった。（Cavaliere-吉野) Message passingはレプリカ理論(Yoshino 2020, 2023)と相補的なアプローチであり、かつ新しい学習アルゴリズムとして用いることも可能である。ネットワークのアーキテクチュアとしてはYoshino 2020, 2023と同じく、深さL 幅N の長方形DNNを用いた。ただし今回はシナプス結合は連続値ではなく+-1の離散値を取る模型を採用した。そのためにまずこの系に適合したレプリカ理論を構築し、生徒ー教師シナリオの場合の学習を解析した。その結果、連続値の場合Yoshino2020,2023と定性的に同じような結果が得られることを確かめた。次に、シナプス結合が十分密であることを念頭に、relaxed BP のアルゴリズムを具体的に構成し、生徒ー教師シナリオでの解析を開始した。その結果、ネットーワークがそれほど深くない場合には、アルゴリズムの収束性が良く、レプリカ理論と一致する結果を得ることに成功した。ネットワークが深くなった場合の収束性の改善は来年度の課題である。またこれに並行し、これまでの人工データに基づく学習の統計力学的解析(Yoshino 2020,2023)から得られた知見を基に、現実の画像データ（MNIST)の分類・ノイズ除去を行う深層学習の統計力学的解析を大規模数値計算によって行った。その結果、深層学習に標準的に用いられているSGDによってある種の定常状態が達成されること、人工データの場合と同様に学習がネットワーク内で空間的に不均一になることがわかった。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 message passing の方法の開発がほぼ予定通り進行した。この際、シナプス結合が離散値をとる場合のレプリカ理論も併せて構築し、シナプス結合が連続値を取る場合(Yoshino 2020, 2023)と同じように空間的に不均一な学習が起こることを確かめることもできた。　これは深層学習における統計力学的性質の普遍性を示唆するものと言える。さらにmessage passing の方法でレプリカ法の結果と整合する結果を得つつある。レプリカ理論はexactな解を与えていると信じられるが、rigorousな方法ではない。そのため別ルートでの検証ができつつあることは大変重要である。またこの研究では、Yoshino2023で指摘した、ローカルな対称性(i)同じ層内でのパーセプトロンの置換（ii) パーセプトロン毎の局所的なゲージ変換、を崩してマシン間の重なり(overlap)を有限系でも測定可能にする工夫を行なったことが功を奏している。この方法は今後のsimulationによる研究でも活用できる。一方で、人工データに基づいたこれまでの研究を超えて、現実の画像データ(MNIST)を用いた大規模数しシミュレーションによって、これまでの統計力学的な理論解析で予言していた「空間的に不均一な学習」が、現実的な設定の深層学習でも確かめられたことの意義は大変大きい。またSGDによる学習ダイナミックスによって系が定常状態に達し、ある種の熱平衡が起こっていることが確かめられたことの意義も大きい。
今後の研究の推進方策	2023年度に引き継き、教師-生徒シナリオに関してmessage passingで学習を行うアルゴリズムの開発を進める。この際、ネットワークが深くなった際のアルゴリズムの収束性を改善する工夫を行うことがポイントとなる。レプリカ理論の結果との詳細な比較もより詳しく行い、理論の相互チェックを進める。これに並行し、Fashion MNIST、CIFAR-10などより複雑なデータについても大規模数値シミュレーションによる解析を行い、統計力学的性質の普遍性を明らかにする。さらに、人工データに基づく統計力学的理論についても、これまで無視されてきたデータの相関の効果を取り入れる拡張を行う。

報告書

(4件)

研究成果
(37件)

すべて 2024 2023 2022 2021 その他

すべて国際共同研究 (3件) 雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 2件) 学会発表 (31件) (うち国際学会 5件、招待講演 13件) 備考 (1件)

[国際共同研究] Ecole Normale Superieure(フランス)
- 関連する報告書
  2022 実施状況報告書
[国際共同研究] Sapienza University di Roma(イタリア)
- 関連する報告書
  2022 実施状況報告書
[国際共同研究] 中国科学院理論物理研究所(中国)
- 関連する報告書
  2022 実施状況報告書
[雑誌論文] Spatially heterogeneous learning by a deep student machine2023
- 著者名/発表者名
  Yoshino Hajime
- 雑誌名
  
  Physical Review Research
  
  巻: 5 号: 3
- DOI
  10.1103/physrevresearch.5.033068
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[雑誌論文] 深層ニューラルネットワークの解剖――統計力学によるアプローチ2021
- 著者名/発表者名
  吉野元
- 雑誌名
  
  日本物理学会誌
  
  巻: 76 号: 9 ページ: 589-594
- DOI
  10.11316/butsuri.76.9_589
- NAID
  130008084796
- ISSN
  0029-0181, 2423-8872
- 年月日
  2021-09-05
- 関連する報告書
  2021 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] 画像データを用いた深層学習における長時間ダイナミックス2024
- 著者名/発表者名
  織戸悠輔, 吉野元
- 学会等名
  日本物理学会2024年春季大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 相関をもつデータを学習するパーセプトロンのレプリカ解析2024
- 著者名/発表者名
  吉田桃大, 吉野元
- 学会等名
  日本物理学会2024年春季大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Statistical mechanics of a deep neural network2023
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  STATPHYS28
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] 深層ニューラルネットワークのアンサンブル理論2023
- 著者名/発表者名
  深層学習の統計力学
- 学会等名
  第１１回統計物理学懇談会
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] Feed-forward型ニューラルネットワークのスピングラス転送行列表示2023
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会第78回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 画像データを用いた深層学習における隠れ層のレプリカ相関2023
- 著者名/発表者名
  織戸悠輔, 吉野元
- 学会等名
  日本物理学会第78回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Heterogeneous RSB in deep RBM-like spin glasses2023
- 著者名/発表者名
  Yuki Hamano, Hajime Yoshino
- 学会等名
  日本物理学会第78回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023
- 著者名/発表者名
  Angelo Giorgio Cavaliere, Hajime Yoshino
- 学会等名
  日本物理学会第78回年次大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023
- 著者名/発表者名
  Angelo Giorgio Cavaliere, Riki Nagasawa, Shuta Yokoi, Tomoyuki Obuchi, Hajime Yoshino
- 学会等名
  STATPHYS28
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Spatial evolution of RSB in layered p-spin models2023
- 著者名/発表者名
  Yuki Rea Hamano, Hajime Yoshino
- 学会等名
  STATPHYS28
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Statistical mechanics of a deep neural network2023
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  International conference on MACHINE LEARNING PHYSICS
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023
- 著者名/発表者名
  Angelo Giorgio Cavaliere
- 学会等名
  International conference on MACHINE LEARNING PHYSICS
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] 深層学習の情報統計力学2023
- 著者名/発表者名
  吉野元
- 学会等名
  「学習物理学の創成」領域会議
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] Random energy model in a pure ferromagnet2023
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023
- 著者名/発表者名
  Angelo Giorgio Cavaliere, Riki Nagasawa, Shuta Yokoi, Tomoyuki Obuchi and Hajime Yoshino
- 学会等名
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- 関連する報告書
  2022 実施状況報告書
[学会発表] Spatial evolution of RSB in layered p-spin models2023
- 著者名/発表者名
  Yuki Rea Hamano and Hajime Yoshino
- 学会等名
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- 関連する報告書
  2022 実施状況報告書
[学会発表] Analysis of point-to-set lengths by 1+d dim replicated liquid theory in large-d limit2023
- 著者名/発表者名
  Yukihiro Tomita and Hajime Yoshino
- 学会等名
  Physics of dense and active disordered materials”, YITP, Kyoto Univ.
- 関連する報告書
  2022 実施状況報告書
[学会発表] 深層ニューラルネットワークにおける隠れた多様体模型の解析2023
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会2023年度春季大会（オンライン開催)
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] Spatially Heteterogeneous Learning in a Deep Neural Network2023
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  Towards a theory of artificial and biological neural networks, Les Houches, France.
- 関連する報告書
  2022 実施状況報告書
[学会発表] 深層パーセプトロン学習における熱平衡化2022
- 著者名/発表者名
  吉野元
- 学会等名
  物性研究所スパコン共同利用・CCMS合同研究会「計算物質科学の新展開」(東大物性研究所）
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] 深層学習の統計力学とガラス的な濡れ転移2022
- 著者名/発表者名
  吉野元
- 学会等名
  研究会「非平衡ソフトマター・アモルファス物質の物性解明への力学的自己組織化からの挑戦」（東大生産研究所)
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] Statistical Mechanics of a Deep Neural Network2022
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  Forum de Physique Statistique a l’Ecole Normale Superieure, (ENS Paris).
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] Spatial heterogeneity in a deep student machine2022
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  Jean-Philippe Bouchaud: a rare event? (Theatre de la Reine Blanche, Paris)
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] 深層ニューラルネットワークにおけるレプリカ対称性の破れ2022
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会シンポジウム「Parisi のスピングラス理論と複雑系研究の発展」(オンライン開催 )
- 関連する報告書
  2022 実施状況報告書
- 招待講演
[学会発表] 深層ニューラルネットワークの統計力学におけるガラスの物理2022
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会シンポジウム
- 関連する報告書
  2021 実施状況報告書
- 招待講演
[学会発表] 深層ニューラルネットワークの汎化に関するレプリカ理論2022
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 深層ニューラルネットワークによる教師-生徒シナリオのシミュレーション2022
- 著者名/発表者名
  ジョンソクダム, 吉野元
- 学会等名
  日本物理学会
- 関連する報告書
  2021 実施状況報告書
[学会発表] 深層パーセプトロンネットワークにおける学習の統計力学2021
- 著者名/発表者名
  吉野元
- 学会等名
  情報数物研究会
- 関連する報告書
  2021 実施状況報告書
- 招待講演
[学会発表] Design space of a deep neural network - its spatial evolution and robustness2021
- 著者名/発表者名
  Hajime Yoshino
- 学会等名
  Institute for Physics of Intelligence
- 関連する報告書
  2021 実施状況報告書
- 招待講演
[学会発表] 深層ニューラルネットワークにおけるレプリカ対称性の破れとその空間構造2021
- 著者名/発表者名
  吉野元
- 学会等名
  Deep Learning and Physics 2021
- 関連する報告書
  2021 実施状況報告書
- 招待講演
[学会発表] 教師-生徒シナリオによる深層パーセプトロン学習の頑健性2021
- 著者名/発表者名
  吉野元
- 学会等名
  日本物理学会
- 関連する報告書
  2021 実施状況報告書
[備考] 深層ニューラルネットワークの統計力学
- URL
  http://www.cp.cmc.osaka-u.ac.jp/~yoshino/dnn.html
- 関連する報告書
  2023 実施状況報告書

深層ニューラルネットワークの情報統計力学

研究代表者

吉野 元 大阪大学, サイバーメディアセンター, 教授 (50335337)

25,090千円 (直接経費: 19,300千円、間接経費: 5,790千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] Ecole Normale Superieure(フランス)

関連する報告書

[国際共同研究] Sapienza University di Roma(イタリア)

関連する報告書

[国際共同研究] 中国科学院理論物理研究所(中国)

関連する報告書

[雑誌論文] Spatially heterogeneous learning by a deep student machine2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] 深層ニューラルネットワークの解剖――統計力学によるアプローチ2021

著者名/発表者名

雑誌名

DOI

NAID

ISSN

年月日

関連する報告書

[学会発表] 画像データを用いた深層学習における長時間ダイナミックス2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] 相関をもつデータを学習するパーセプトロンのレプリカ解析2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Statistical mechanics of a deep neural network2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層ニューラルネットワークのアンサンブル理論2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Feed-forward型ニューラルネットワークのスピングラス転送行列表示2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 画像データを用いた深層学習における隠れ層のレプリカ相関2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Heterogeneous RSB in deep RBM-like spin glasses2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Spatial evolution of RSB in layered p-spin models2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Statistical mechanics of a deep neural network2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層学習の情報統計力学2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Random energy model in a pure ferromagnet2023

吉野元大阪大学, サイバーメディアセンター, 教授 (50335337)