超巨大ニューラルネットの継続学習への型破りな線形代数技術の適用

研究課題

研究課題/領域番号	20K20624
研究種目	挑戦的研究(開拓)
配分区分	基金
審査区分	中区分60:情報科学、情報工学およびその関連分野
研究機関	東京工業大学
研究代表者	横田理央東京工業大学, 学術国際情報センター, 教授 (20760573)
研究分担者	Khan Emtiyaz 国立研究開発法人理化学研究所, 革新知能統合研究センター, チームリーダー (30858022) 大島聡史名古屋大学, 情報基盤センター, 准教授 (40570081) 伊田明弘国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報基盤センター), 副主任研究員 (80742121)
研究期間 (年度)	2020-07-30 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	25,350千円 (直接経費: 19,500千円、間接経費: 5,850千円) 2022年度: 7,280千円 (直接経費: 5,600千円、間接経費: 1,680千円) 2021年度: 7,410千円 (直接経費: 5,700千円、間接経費: 1,710千円) 2020年度: 10,660千円 (直接経費: 8,200千円、間接経費: 2,460千円)
キーワード	階層的低ランク近似法 / 深層学習 / 行列分解 / テンソルコア / 密行列の高速解法 / 階層的低ランク近似 / H行列 / LU分解 / 2次最適化 / 継続学習 / クロネッカー因子分解 / ２次最適化 / 分散深層学習 / 線形代数ライブラリ / GPU
研究開始時の研究の概要	近年の深層学習は個々のタスクに特化した小規模なモデルを皆が冗長に学習するのではなく、大規模なモデルを用いて様々なタスクを一元的かつ継続的に学習する方向に向かっている。しかし、国内のAI分野の研究には、GAFAなどの膨大なデータ、計算資源、人的資源を持つ企業と同じ土俵で競争しようとするものは少ない。本研究は、これらの企業との超高精度・超大型のDNNを学習する競争に果敢に挑み、世界最大の複数のスパコンを利用できる恵まれた計算環境と、二次最適化の分散並列実装という独自技術を用いて画像処理や自然言語処理などの幅広いタスクで国際的に優位性を示すことを目指している。
研究成果の概要	深層継続学習ではFisher情報行列の行列分解を用いることで性能が向上することが示されている。しかし、Fisher情報行列はパラメータ数Nの2乗の要素数を持つ密行列であるため、そのまま行列分解を直接行うことが困難である。本研究では階層的低ランク近似法であるH^2行列を用いることで、この計算量をO(N)に低減した。さらに、fill-inブロックを予め計算し共有基底に含めてULV分解を行うことでに全ての対角ブロックを並列に処理する手法を提案した。また、テンソルコアのような低精度演算器でも悪条件の行列の分解ができるよう、精度を補正する手法を開発した。
研究成果の学術的意義や社会的意義	Fisher情報行列は継続学習やモデル・マージング、連合学習を行う際に有用であることが知られているが、その計算コストは膨大でありモデルの規模が近年急激に増大していることからも、その計算を高速化する手法が求められている。これまでKronecker因子分解による近似を行うことでO(N^1.5)の計算量にする方法が提案されているが、本研究ではこれをO(N)にまで低減できたことは意義深い。これにより、継続学習、モデル・マージング、連合学習の研究が加速すれば、一部の限られた大企業の専売特許となっている大規模な生成モデルの構築が、より多くの研究者の共同作業によって分担して構築できるようになる。

報告書

(5件)

研究成果
(24件)

すべて 2024 2023 2022 その他

すべて国際共同研究 (2件) 雑誌論文 (9件) (うち国際共著 2件、査読あり 9件) 学会発表 (13件) (うち国際学会 11件)

[国際共同研究] University of Tennessee(米国)
- 関連する報告書
  2023 実績報告書
[国際共同研究] University of Tennessee at Knoxville(米国)
- 関連する報告書
  2022 実施状況報告書
[雑誌論文] An Inherently Parallel H^2-ULV Factorization for Solving Dense Linear Systems on GPUs2024
- 著者名/発表者名
  Qianxiang Ma, Rio Yokota
- 雑誌名
  
  International Journal of High Performance Computing Applications
  
  巻: N/A ページ: 1-10
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] DGEMM on Integer Matrix Multiplication Unit2024
- 著者名/発表者名
  Hiroyuki Ootomo, Katsuhisa Ozaki, Rio Yokota
- 雑誌名
  
  International Journal of High Performance Computing Applications
  
  巻: N/A ページ: 1-10
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors2023
- 著者名/発表者名
  Deshmukh Sameer、Yokota Rio、Bosilca George
- 雑誌名
  
  ACM Transactions on Mathematical Software
  
  巻: 49 号: 3 ページ: 1-29
- DOI
  10.1145/3595178
- 関連する報告書
  2023 実績報告書
- 査読あり / 国際共著
[雑誌論文] Computing the k-th Eigenvalue of Symmetric H2-Matrices2023
- 著者名/発表者名
  Apriansyah M. Ridwan、Yokota Rio
- 雑誌名
  
  International Conference on Parallel Processing (ICPP)
  
  巻: N/A ページ: 1-10
- DOI
  10.1145/3605573.3605607
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] O(N) distributed direct factorization of structured dense matrices using runtime systems.2023
- 著者名/発表者名
  Deshmukh Sameer、Yokota Rio、Bosilca George、Ma Qinxiang
- 雑誌名
  
  International Conference on Parallel Processing (ICPP)
  
  巻: N/A ページ: 1-10
- DOI
  10.1145/3605573.3605606
- 関連する報告書
  2023 実績報告書
- 査読あり / 国際共著
[雑誌論文] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023
- 著者名/発表者名
  Ootomo Hiroyuki、Yokota Rio
- 雑誌名
  
  Platform for Advanced Scientific Computing (PASC)
  
  巻: N/A ページ: 1-10
- DOI
  10.1145/3592979.3593413
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors2023
- 著者名/発表者名
  Sameer Deshmukh, Rio Yokota, George Bosilca
- 雑誌名
  
  ACM Transactions on Mathematical Software
  
  巻: 未定
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[雑誌論文] Parallel QR Factorization of Block Low-Rank Matrices2022
- 著者名/発表者名
  Muhammad Ridwan Apriansyah, Rio Yokota
- 雑誌名
  
  ACM Transactions on Mathematical Software
  
  巻: 48(3) 号: 3 ページ: 1-28
- DOI
  10.1145/3538647
- 関連する報告書
  2023 実績報告書 2022 実施状況報告書
- 査読あり
[雑誌論文] Recovering Single Precision Accuracy from Tensor Cores While Surpassing the FP32 Theoretical Peak Performance2022
- 著者名/発表者名
  Hiroyuki Ootomo, Rio Yokota
- 雑誌名
  
  The International Journal of High Performance Computing Application
  
  巻: 1 ページ: 1-1
- 関連する報告書
  2021 実施状況報告書
- 査読あり
[学会発表] Computing the k-th Eigenvalue of Symmetric H2-Matrices2023
- 著者名/発表者名
  Apriansyah M. Ridwan、Yokota Rio
- 学会等名
  International Conference on Parallel Processing (ICPP)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] O(N) distributed direct factorization of structured dense matrices using runtime systems.2023
- 著者名/発表者名
  Deshmukh Sameer、Yokota Rio、Bosilca George、Ma Qinxiang
- 学会等名
  International Conference on Parallel Processing (ICPP)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023
- 著者名/発表者名
  Ootomo Hiroyuki、Yokota Rio
- 学会等名
  Platform for Advanced Scientific Computing (PASC)
- 関連する報告書
  2023 実績報告書
- 国際学会
[学会発表] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023
- 著者名/発表者名
  Hiroyuki Ootomo, Rio Yokota
- 学会等名
  Platform for Advanced Scientific Computing (PASC)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] O(N) Factorization of Dense Matrices on GPUs Without Trailing Submatrix Dependencies2023
- 著者名/発表者名
  Qianxiang Ma, Rio Yokota
- 学会等名
  SIAM Conference on Computational Science and Engineering (CSE)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Parallel QR Factorization of Block Low-Rank Matrices2023
- 著者名/発表者名
  Muhammad Ridwan Apriansyah, Rio Yokota
- 学会等名
  SIAM Conference on Computational Science and Engineering (CSE)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] QR Factorization of Block Low-Rank Matrices on Multi-Instance GPU2022
- 著者名/発表者名
  Satoshi Ohshima, Akihiro Ida, Rio Yokota and Ichitaro Yamazaki
- 学会等名
  The 23rd International Conference on Parallel and Distributed Computing, Applications and Technologies (PDCAT’22)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Scalable Linear Time Dense Direct Solver for 3-D Problems Without Trailing Sub-Matrix Dependencies2022
- 著者名/発表者名
  Qianxiang Ma, Sameer Deshmukh, Rio Yokota
- 学会等名
  The International Conference for High Performance Computing, Networking, Storage, and Analysis (SC22)
- 関連する報告書
  2022 実施状況報告書
- 国際学会
[学会発表] Acceleration of O(N) Solvers for Large Dense Matrices2022
- 著者名/発表者名
  Sameer Deshmukh
- 学会等名
  Conference on Advance Topics and Auto Tuning in High-Performance Scientific Computing (ATAT2022)
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] Parallel QR Factorization of Block Low-rank Matrices2022
- 著者名/発表者名
  Muhammad Ridwan Apriansyah
- 学会等名
  Conference on Advance Topics and Auto Tuning in High-Performance Scientific Computing (ATAT2022)
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] Iterative Refinement with Hierarchical Low-rank Preconditioners Using Mixed Precision2022
- 著者名/発表者名
  Thomas Spendlhofer
- 学会等名
  Conference on Advance Topics and Auto Tuning in High-Performance Scientific Computing (ATAT2022)
- 関連する報告書
  2021 実施状況報告書
- 国際学会
[学会発表] 深層学習における2次最適化の汎化性能の検証2022
- 著者名/発表者名
  石井央，横田理央
- 学会等名
  第84回情報処理学会全国大会
- 関連する報告書
  2021 実施状況報告書
[学会発表] Vision Transformerにおけるバッチサイズの汎化性能への影響2022
- 著者名/発表者名
  中村秋海，横田理央
- 学会等名
  第84回情報処理学会全国大会
- 関連する報告書
  2021 実施状況報告書

超巨大ニューラルネットの継続学習への型破りな線形代数技術の適用

研究代表者

横田 理央 東京工業大学, 学術国際情報センター, 教授 (20760573)

25,350千円 (直接経費: 19,500千円、間接経費: 5,850千円)

報告書

研究成果

[国際共同研究] University of Tennessee(米国)

関連する報告書

[国際共同研究] University of Tennessee at Knoxville(米国)

関連する報告書

[雑誌論文] An Inherently Parallel H^2-ULV Factorization for Solving Dense Linear Systems on GPUs2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] DGEMM on Integer Matrix Multiplication Unit2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Computing the k-th Eigenvalue of Symmetric H2-Matrices2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] O(N) distributed direct factorization of structured dense matrices using runtime systems.2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors2023

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Parallel QR Factorization of Block Low-Rank Matrices2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Recovering Single Precision Accuracy from Tensor Cores While Surpassing the FP32 Theoretical Peak Performance2022

著者名/発表者名

雑誌名

関連する報告書

[学会発表] Computing the k-th Eigenvalue of Symmetric H2-Matrices2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] O(N) distributed direct factorization of structured dense matrices using runtime systems.2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] O(N) Factorization of Dense Matrices on GPUs Without Trailing Submatrix Dependencies2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Parallel QR Factorization of Block Low-Rank Matrices2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] QR Factorization of Block Low-Rank Matrices on Multi-Instance GPU2022

著者名/発表者名

学会等名

関連する報告書

[学会発表] Scalable Linear Time Dense Direct Solver for 3-D Problems Without Trailing Sub-Matrix Dependencies2022

横田理央東京工業大学, 学術国際情報センター, 教授 (20760573)