• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 実施状況報告書

深層ニューラルネットワークの情報統計力学

研究課題

研究課題/領域番号 21K18146
研究機関大阪大学

研究代表者

吉野 元  大阪大学, サイバーメディアセンター, 教授 (50335337)

研究期間 (年度) 2021-07-09 – 2025-03-31
キーワード深層学習 / ニューラルネットワーク / 情報統計力学
研究実績の概要

2023年度は、生徒-教師シナリオに基づいたDeep Neural Network(DNN)による学習をmessage passingによって行う方法の構築を行なった。(Cavaliere-吉野) Message passingはレプリカ理論(Yoshino 2020, 2023)と相補的なアプローチであり、かつ新しい学習アルゴリズムとして用いることも可能である。ネットワークのアーキテクチュアとしてはYoshino 2020, 2023と同じく、深さL 幅N の長方形DNNを用いた。ただし今回はシナプス結合は連続値ではなく+-1の離散値を取る模型を採用した。そのためにまずこの系に適合したレプリカ理論を構築し、生徒ー教師シナリオの場合の学習を解析した。その結果、連続値の場合Yoshino2020,2023と定性的に同じような結果が得られることを確かめた。次に、シナプス結合が十分密であることを念頭に、relaxed BP のアルゴリズムを具体的に構成し、生徒ー教師シナリオでの解析を開始した。その結果、ネットーワークがそれほど深くない場合には、アルゴリズムの収束性が良く、レプリカ理論と一致する結果を得ることに成功した。ネットワークが深くなった場合の収束性の改善は来年度の課題である。
またこれに並行し、これまでの人工データに基づく学習の統計力学的解析(Yoshino 2020,2023)から得られた知見を基に、現実の画像データ(MNIST)の分類・ノイズ除去を行う深層学習の統計力学的解析を大規模数値計算によって行った。その結果、深層学習に標準的に用いられているSGDによってある種の定常状態が達成されること、人工データの場合と同様に学習がネットワーク内で空間的に不均一になることがわかった。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

message passing の方法の開発がほぼ予定通り進行した。この際、シナプス結合が離散値をとる場合のレプリカ理論も併せて構築し、シナプス結合が連続値を取る場合(Yoshino 2020, 2023)と同じように空間的に不均一な学習が起こることを確かめることもできた。 これは深層学習における統計力学的性質の普遍性を示唆するものと言える。さらにmessage passing の方法でレプリカ法の結果と整合する結果を得つつある。レプリカ理論はexactな解を与えていると信じられるが、rigorousな方法ではない。そのため別ルートでの検証ができつつあることは大変重要である。またこの研究では、Yoshino2023で指摘した、ローカルな対称性(i)同じ層内でのパーセプトロンの置換(ii) パーセプトロン毎の局所的なゲージ変換、を崩してマシン間の重なり(overlap)を有限系でも測定可能にする工夫を行なったことが功を奏している。この方法は今後のsimulationによる研究でも活用できる。
一方で、人工データに基づいたこれまでの研究を超えて、現実の画像データ(MNIST)を用いた大規模数しシミュレーションによって、これまでの統計力学的な理論解析で予言していた「空間的に不均一な学習」が、現実的な設定の深層学習でも確かめられたことの意義は大変大きい。またSGDによる学習ダイナミックスによって系が定常状態に達し、ある種の熱平衡が起こっていることが確かめられたことの意義も大きい。

今後の研究の推進方策

2023年度に引き継き、教師-生徒シナリオに関してmessage passingで学習を行うアルゴリズムの開発を進める。この際、ネットワークが深くなった際のアルゴリズムの収束性を改善する工夫を行うことがポイントとなる。レプリカ理論の結果との詳細な比較もより詳しく行い、理論の相互チェックを進める。これに並行し、Fashion MNIST、CIFAR-10などより複雑なデータについても大規模数値シミュレーションによる解析を行い、統計力学的性質の普遍性を明らかにする。さらに、人工データに基づく統計力学的理論についても、これまで無視されてきたデータの相関の効果を取り入れる拡張を行う。

次年度使用額が生じた理由

特任研究員の雇用が予定よりも遅れて始まり、研究期間を延長したため。

  • 研究成果

    (15件)

すべて 2024 2023 その他

すべて 雑誌論文 (1件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (13件) (うち国際学会 5件、 招待講演 2件) 備考 (1件)

  • [雑誌論文] Spatially heterogeneous learning by a deep student machine2023

    • 著者名/発表者名
      Yoshino Hajime
    • 雑誌名

      Physical Review Research

      巻: 5 ページ: 033068-1/28

    • DOI

      10.1103/PhysRevResearch.5.033068

    • 査読あり / オープンアクセス
  • [学会発表] 画像データを用いた深層学習における長時間ダイナミックス2024

    • 著者名/発表者名
      織戸悠輔, 吉野元
    • 学会等名
      日本物理学会2024年春季大会
  • [学会発表] 相関をもつデータを学習するパーセプトロンのレプリカ解析2024

    • 著者名/発表者名
      吉田桃大, 吉野元
    • 学会等名
      日本物理学会2024年春季大会
  • [学会発表] Statistical mechanics of a deep neural network2023

    • 著者名/発表者名
      Hajime Yoshino
    • 学会等名
      STATPHYS28
    • 国際学会
  • [学会発表] 深層ニューラルネットワークのアンサンブル理論2023

    • 著者名/発表者名
      深層学習の統計力学
    • 学会等名
      第11回統計物理学懇談会
    • 招待講演
  • [学会発表] Feed-forward型ニューラルネットワークのスピングラス転送行列表示2023

    • 著者名/発表者名
      吉野元
    • 学会等名
      日本物理学会第78回年次大会
  • [学会発表] 画像データを用いた深層学習における隠れ層のレプリカ相関2023

    • 著者名/発表者名
      織戸悠輔, 吉野元
    • 学会等名
      日本物理学会第78回年次大会
  • [学会発表] Heterogeneous RSB in deep RBM-like spin glasses2023

    • 著者名/発表者名
      Yuki Hamano, Hajime Yoshino
    • 学会等名
      日本物理学会第78回年次大会
  • [学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023

    • 著者名/発表者名
      Angelo Giorgio Cavaliere, Hajime Yoshino
    • 学会等名
      日本物理学会第78回年次大会
  • [学会発表] Statistical inference of an assembly of vectors with a large number of components through their p-body products2023

    • 著者名/発表者名
      Angelo Giorgio Cavaliere, Riki Nagasawa, Shuta Yokoi, Tomoyuki Obuchi, Hajime Yoshino
    • 学会等名
      STATPHYS28
    • 国際学会
  • [学会発表] Spatial evolution of RSB in layered p-spin models2023

    • 著者名/発表者名
      Yuki Rea Hamano, Hajime Yoshino
    • 学会等名
      STATPHYS28
    • 国際学会
  • [学会発表] Statistical mechanics of a deep neural network2023

    • 著者名/発表者名
      Hajime Yoshino
    • 学会等名
      International conference on MACHINE LEARNING PHYSICS
    • 国際学会
  • [学会発表] Spatially heterogeneous learning in a deep student machine by message passing2023

    • 著者名/発表者名
      Angelo Giorgio Cavaliere
    • 学会等名
      International conference on MACHINE LEARNING PHYSICS
    • 国際学会
  • [学会発表] 深層学習の情報統計力学2023

    • 著者名/発表者名
      吉野元
    • 学会等名
      「学習物理学の創成」領域会議
    • 招待講演
  • [備考] 深層ニューラルネットワークの統計力学

    • URL

      http://www.cp.cmc.osaka-u.ac.jp/~yoshino/dnn.html

URL: 

公開日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi