線形性と非線形性の協同による可解なランダム神経回路の深化

研究課題

研究課題/領域番号	23K16965
研究種目	若手研究
配分区分	基金
審査区分	小区分61040:ソフトコンピューティング関連
研究機関	国立研究開発法人産業技術総合研究所
研究代表者	唐木田亮国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30803902)
研究期間 (年度)	2023-04-01 – 2028-03-31
研究課題ステータス	交付 (2023年度)
配分額 *注記	4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円) 2027年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2026年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円) 2023年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
キーワード	ニューラルネットワーク / 深層学習 / 機械学習 / 力学系 / 最適化 / 統計物理 / 統計力学的解析 / ランダム行列
研究開始時の研究の概要	本研究課題では, 深層学習に代表されるニューラルネットを用いた機械学習および人工神経回路の数理的基盤となる枠組みを, ランダム結合をもつニューラルネットに基づいた可解モデルによって構築する. 深層学習ではモデルが高次元の非線形変換を繰り返すだけでなく, 多種多様な学習手法の組合せが性能を決めており, そのままでは理論的な取り扱いが困難である. この問題に対し, ランダム結合パラメータを持つモデルでは複雑な動作を粗視化し, 性能を決める少数次元の理論式に縮約できる. また, 粗視化によって, モデルや学習の設定の詳細に依存しない普遍的な数理的基礎付けが実現できると期待される.
研究実績の概要	本研究の目的は, 深層学習に代表されるニューラルネットを用いた機械学習および人工神経回路を理解するための数理的基盤となる可解模型を, ランダム神経回路を起点に整備・拡張を実施することである. 非線形変換の部分的な線形化を利用することで, 従来は解析が困難だった学習の問題に対し, 数理的な理解や新しい法則の発見を目指す. 本年度はまず対角線形ネットと呼ばれる可解模型の解析を進めた. 具体的には解の探索を動的に支配する勾配正則化において, 望ましい学習レジーム(リッチレジーム)への陰的バイアスが働いていることを明らかにした. これはパラメータの非線形性があるがゆえに, 勾配法の動的な解の選択が生じる例となっており, ある程度大きな有限学習ステップの重要性まで示唆している. ベンチマークにおける実験的な実証も合わせて行い, この可解模型の挙動が定性的に複雑なモデルの挙動を捉えていることを支持している. さらに本研究は, 一見関係がみえないSAMやFloodingといった最急降下と上昇を組合せる手法が有限差分をとおして勾配正則化につながることまで明らかにした点も機械学習の観点から興味深い成果である. また, 本年度はランダム神経回路の一系統である連想記憶モデル, 具体的にはModern Hopfield Network (MHN)においても成果を得た. MHNにはモデルA,B,Cの3系統が知られており, 特にモデルBは注意機構に対応する. これらのモデルのエネルギーから自然にボルツマンマシンを導入できるが, モデルAが指数型分布族調和モデルに含まれ, モデルBがガウス-ベルヌーイRBMの近似となることが判明した. 後者は尤度が解析的に可解な点でも興味深い. このような様々な非線形変換のモデル分類が進むことで, より込み入ったモデルの理解の基盤となることが期待できる.
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由対角線形ネットは深層学習で開発されたアルゴリズムや学習手法の挙動を矛盾なく説明できる最も単純な可解モデルと期待される. 線形ネットという名前のとおり, 線形写像ではあるが, パラメータは非線形性を持つ. このモデルで, 動的な平坦な解探索の実装上まず第一に考えられる一次勾配ベースの正則化を解析できたことは, より込み入った陽な/陰な正則化を理解・開発するうえで重要な知見となることが期待できる.このような成果を機械学習のトップ国際会議のひとつで発表できたことは十分な成果といえるだろう. また連想記憶モデルについては単層の観点から整備を進めることができた. 特に, 注意機構型の連想記憶モデルは統計力学的な解析の観点から注目を集めているもので, その新規性や意義について, ボルツマンマシンの観点から示唆を与えている. すなわちボルツマンマシンとしてはたしかに新しいものであるが, 既存のRBMと大きな差はないことをいくつかの解析で明らかにしている. 近年の深層学習が基盤とする自己注意機構の理解につながるかは後述のとおり今後の課題であるが, そうした問題提起につながる点でも重要なステップとなったといえる.
今後の研究の推進方策	本年度は幅無限大におけるランダム神経回路の解析は成果としてあげていないため, これを達成することは目的のひとつである. 特に, 近年は特徴学習レジームを実現するパラメータ表示の同定が重要な課題となっており, 知識転移や込み入った学習手法に対して, どこまで定量的な示唆が与えられるかが本課題にとっても重要である. また, 本年度は単層のクロスアテンションに対してある程度の洞察をえたが, 自己注意機構については通常のHopfield networkエネルギーとは相互作用の入り方が異なるため, 理解が単純には及ばない. ランダム神経回路あるいは別系統の理想化によって, その限界や利点を明らかにすることが課題となるだろう. 最後に, 本課題は単純なモデルがまだ確立されていない機械学習の問題において可解モデルから知見を与えることを大目標のひとつとしている. 特に知識転移については本年度は予備的成果にとどまったので, 重点的に進めることが望ましい.

報告書

(1件)

2023 実施状況報告書

研究成果
(9件)

すべて 2024 2023 その他

すべて国際共同研究 (1件) 雑誌論文 (2件) (うち査読あり 2件、オープンアクセス 1件) 学会発表 (5件) (うち国際学会 2件、招待講演 2件) 備考 (1件)

[国際共同研究] チューリッヒ工科大学(スイス)
- 関連する報告書
  2023 実施状況報告書
[雑誌論文] Attention in a Family of Boltzmann Machines Emerging From Modern Hopfield Networks2023
- 著者名/発表者名
  Ota Toshihiro、Karakida Ryo
- 雑誌名
  
  Neural Computation
  
  巻: 35 号: 8 ページ: 1463-1480
- DOI
  10.1162/neco_a_01597
- 関連する報告書
  2023 実施状況報告書
- 査読あり
[雑誌論文] Understanding Gradient Regularization in Deep Learning: Efficient Finite-Difference Computation and Implicit Bias2023
- 著者名/発表者名
  Ryo Karakida, Tomoumi Takase, Tomohiro Hayase & Kazuki Osawa
- 雑誌名
  
  Proceedings of ICLR (PMLR)
  
  巻: 202 ページ: 1-19
- 関連する報告書
  2023 実施状況報告書
- 査読あり / オープンアクセス
[学会発表] 特徴学習領域における最終層のスケール解析2024
- 著者名/発表者名
  唐木田亮
- 学会等名
  日本物理学会春季大会
- 関連する報告書
  2023 実施状況報告書
[学会発表] Self-knowledge forgetting in continual learning: Insight from a solvable overparameterized model2023
- 著者名/発表者名
  唐木田亮
- 学会等名
  人工知能学会
- 関連する報告書
  2023 実施状況報告書
[学会発表] 深層学習アルゴリズムを操る2023
- 著者名/発表者名
  唐木田亮
- 学会等名
  MCMEセミナー
- 関連する報告書
  2023 実施状況報告書
- 招待講演
[学会発表] Understanding deep-learning algorithms through learning regimes2023
- 著者名/発表者名
  Ryo Karakida
- 学会等名
  International conference on MACHINE LEARNING PHYSICS
- 関連する報告書
  2023 実施状況報告書
- 国際学会
[学会発表] Understanding Implicit Bias of Learning Dynamics in Overparameterized Regimes2023
- 著者名/発表者名
  Ryo Karakida
- 学会等名
  9IDMRCS
- 関連する報告書
  2023 実施状況報告書
- 国際学会 / 招待講演
[備考] 代表者個人webページ
- URL
  https://sites.google.com/view/ryokarakida/
- 関連する報告書
  2023 実施状況報告書

線形性と非線形性の協同による可解なランダム神経回路の深化

研究代表者

唐木田 亮 国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30803902)

4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)

現在までの達成度 (区分)

理由

報告書

研究成果

[国際共同研究] チューリッヒ工科大学(スイス)

関連する報告書

[雑誌論文] Attention in a Family of Boltzmann Machines Emerging From Modern Hopfield Networks2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Understanding Gradient Regularization in Deep Learning: Efficient Finite-Difference Computation and Implicit Bias2023

著者名/発表者名

雑誌名

関連する報告書

[学会発表] 特徴学習領域における最終層のスケール解析2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Self-knowledge forgetting in continual learning: Insight from a solvable overparameterized model2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 深層学習アルゴリズムを操る2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Understanding deep-learning algorithms through learning regimes2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Understanding Implicit Bias of Learning Dynamics in Overparameterized Regimes2023

著者名/発表者名

学会等名

関連する報告書

[備考] 代表者個人webページ

URL

関連する報告書

唐木田亮国立研究開発法人産業技術総合研究所, 情報・人間工学領域, 主任研究員 (30803902)