Acceleration of kernel with random access and data recurrence on many computer architectures

Research Project

Project/Area Number	22K12057
Research Category	Grant-in-Aid for Scientific Research (C)
Allocation Type	Multi-year Fund
Section	一般
Review Section	Basic Section 60100:Computational science-related
Research Institution	The University of Tokyo
Principal Investigator	藤田航平東京大学, 地震研究所, 准教授 (00744856)
Project Period (FY)	2022-04-01 – 2025-03-31
Project Status	Granted (Fiscal Year 2023)
Budget Amount *help	¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000) Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000) Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000) Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywords	ランダムアクセス / データレカレンス / 高性能計算 / 有限要素法
Outline of Research at the Start	計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指す。
Outline of Annual Research Achievements	計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指している。本年度においては、昨年度実施した富岳のA64FX CPU, Intel Xeon CPU, NVIDIA GPUに加え、AMD GPUにおける性能評価を進めると共に、ランダムアクセスが主体となる疎行列ベクトル計算自体を連続データアクセスが主体となるデータ駆動型アルゴリズムに変換する開発・GPU実装を実施した。まず、ランダムアクセスを多く含むカーネルの一例として、非構造格子を用いた確率有限要素法における疎行列ベクトル積カーネルに注目し、AMD GPUにおいて性能評価を実施した。当該GPUは比較的キャッシュサイズが小さいため、疎行列計算における節点の並び替えが性能に大きく影響すること、また、AMD GPU特有の倍幅単精度演算器を使うことでさらに高い性能が得られることがわかった。次に、時系列の地震シミュレーションで用いられるランダムアクセスが主体となる疎行列ソルバーにおいて、連続データアクセスが主体となるデータ駆動型手法を用いて高精度な初期解を予測することで、反復法ソルバーの反復数を減らしランダムアクセス計算を削減・計算を高速化する方法をGPU上で開発した。データ駆動型手法と多数ケースの同時計算によるランダムアクセスの削減により、GPUを使った従来手法と比べて8.6倍の高速化を得た。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 当初計画通り、ランダムアクセスを多く含むカーネルの一例として、地震シミュレーションに用いられる非構造格子有限要素法における行列ベクトル積カーネルに対し、各種計算機におけるアルゴリズム開発・性能分析を実施したため。また、ランダムアクセスの量自体を削減するデータ駆動型アルゴリズムをGPU実装し有効であることを示したため。
Strategy for Future Research Activity	これまで数種類のCPU・GPUにおいて性能調査・アルゴリズム開発を実施したが、今後はより広い計算機アーキテクチャにおける本手法の適用性、また、必要に応じてアルゴリズム開発を実施していく計画である。また、アルゴリズム拡張によりさらなる性能向上が可能か検討する計画である。

Report

(2 results)

2023 Research-status Report
2022 Research-status Report

Research Products
(13 results)

All 2023 2022

All Journal Article (6 results) (of which Peer Reviewed: 6 results, Open Access: 2 results) Presentation (7 results) (of which Int'l Joint Research: 5 results, Invited: 1 results)

[Journal Article] Development of 3D Viscoelastic Crustal Deformation Analysis Solver with Data-Driven Method on GPU2023
- Author(s)
  Murakami Sota、Fujita Kohei、Ichimura Tsuyoshi、Hori Takane、Hori Muneo、Lalith Maddegedara、Ueda Naonori
- Journal Title
  
  Lecture Notes in Computer Science
  
  Volume: 14074 Pages: 423-437
- DOI
  10.1007/978-3-031-36021-3_45
- ISBN
  9783031360206, 9783031360213
- Related Report
  2023 Research-status Report
- Peer Reviewed
[Journal Article] Calculation of cross-correlation function accelerated by TensorFloat-32 Tensor Core operations on NVIDIA’s Ampere and Hopper GPUs2023
- Author(s)
  Fujita Kohei、Yamaguchi Takuma、Kikuchi Yuma、Ichimura Tsuyoshi、Hori Muneo、Maddegedara Lalith
- Journal Title
  
  Journal of Computational Science
  
  Volume: 68 Pages: 101986-101986
- DOI
  10.1016/j.jocs.2023.101986
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] GPU-Accelerated Sparse Matrix Vector Product based on Element-by-Element Method for Unstructured FEM using OpenACC2022
- Author(s)
  Kusakabe Ryota、Fujita Kohei、Ichimura Tsuyoshi、Hori Muneo、Lalith Maddegedara
- Journal Title
  
  2022 Workshop on Accelerator Programming Using Directives (WACCPD)
  
  Volume: - Pages: 52-61
- DOI
  10.1109/waccpd56842.2022.00011
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Scalable Finite-Element Viscoelastic Crustal Deformation Analysis Accelerated with Data-Driven Method2022
- Author(s)
  Fujita Kohei、Murakami Sota、Ichimura Tsuyoshi、Hori Takane、Hori Muneo、Lalith Maddegedara、Ueda Naonori
- Journal Title
  
  2022 IEEE/ACM Workshop on Latest Advances in Scalable Algorithms for Large-Scale Heterogeneous Systems (ScalAH)
  
  Volume: - Pages: 18-25
- DOI
  10.1109/scalah56622.2022.00008
- Related Report
  2022 Research-status Report
- Peer Reviewed / Open Access
[Journal Article] Extreme Scale Earthquake Simulation with Uncertainty Quantification2022
- Author(s)
  Ichimura Tsuyoshi、Fujita Kohei、Kusakabe Ryota、Koyama Kentaro、Murakami Sota、Kikuchi Yuma、Hori Takane、Hori Muneo、Inoue Hikaru、Nose Takafumi、Kawashima Takahiro、Lalith Maddegedara
- Journal Title
  
  SC22: International Conference for High Performance Computing, Networking, Storage and Analysis
  
  Volume: - Pages: 1-11
- DOI
  10.1109/sc41404.2022.00009
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Journal Article] Calculation of Cross-correlation Function Accelerated by Tensor Cores with TensorFloat-32 Precision on Ampere GPU2022
- Author(s)
  Kikuchi Yuma、Fujita Kohei、Ichimura Tsuyoshi、Hori Muneo、Maddegedara Lalith
- Journal Title
  
  Computational Science - ICCS 2022. ICCS 2022. Lecture Notes in Computer Science
  
  Volume: 13351 Pages: 277-290
- DOI
  10.1007/978-3-031-08754-7_37
- ISBN
  9783031087530, 9783031087547
- Related Report
  2022 Research-status Report
- Peer Reviewed
[Presentation] Compression of Scientific Simulation Data by Stochastic Basis Expansion - Example on Multiple Computer Systems2023
- Author(s)
  Kohei Fujita, Tsuyoshi Ichimura, Lalith Maddegedara, Muneo Hori
- Organizer
  PDSW23: 8th International Parallel Data Systems Workshop, Held in Conjunction with SC23: The International Conference for High Performance Computing, Networking, Storage, and Analysis
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] GPU-accelerated viscoelastic crustal deformation analysis with data-driven method2023
- Author(s)
  Sota Murakami, Kohei Fujita, Tsuyoshi Ichimura, Takane Hori, Muneo Hori, Maddededara Lalith
- Organizer
  10th International Conference on Industrial and Applied Mechanics
- Related Report
  2023 Research-status Report
- Int'l Joint Research
[Presentation] Finite-Element Seismic Ground Motion Simulation Enhanced with High-Performance Computing2023
- Author(s)
  Kohei Fujita
- Organizer
  3rd ZHITU Symposium on Advances in Civil Engineering
- Related Report
  2023 Research-status Report
- Int'l Joint Research / Invited
[Presentation] Enhanced Earthquake Simulation with Data-Driven Methods and Stochastic Analysis2022
- Author(s)
  Kohei Fujita
- Organizer
  The 5th R-CCS International symposium
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] 高詳細三次元地盤震動解析手法の開発と，地盤歪のボリュームデータ可視化に関する基礎検討2022
- Author(s)
  藤田航平, 金川航希, 市村強, 堀宗朗, Maddegedara Lalith
- Organizer
  日本地震工学会・大会－ 2022
- Related Report
  2022 Research-status Report
[Presentation] Seismic Wave Simulation from Earthquake Fault to City with Large-Scale Finite-Element Analysis on Fugaku2022
- Author(s)
  Kohei Fujita
- Organizer
  15th World Congress on Computational Mechanics & 8th Asian Pacific Congress on Computational Mechanics
- Related Report
  2022 Research-status Report
- Int'l Joint Research
[Presentation] 都市の詳細3次元地震シミュレーションのための高速・スケーラブルな有限要素法の開発2022
- Author(s)
  藤田航平, 市村強, 堀宗朗, Maddegedara Lalith
- Organizer
  第27回計算工学講演会
- Related Report
  2022 Research-status Report

Acceleration of kernel with random access and data recurrence on many computer architectures

Principal Investigator

藤田 航平 東京大学, 地震研究所, 准教授 (00744856)

¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)

Current Status of Research Progress

Reason

Report

Research Products

[Journal Article] Development of 3D Viscoelastic Crustal Deformation Analysis Solver with Data-Driven Method on GPU2023

Author(s)

Journal Title

DOI

ISBN

Related Report

[Journal Article] Calculation of cross-correlation function accelerated by TensorFloat-32 Tensor Core operations on NVIDIA’s Ampere and Hopper GPUs2023

Author(s)

Journal Title

DOI

Related Report

[Journal Article] GPU-Accelerated Sparse Matrix Vector Product based on Element-by-Element Method for Unstructured FEM using OpenACC2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Scalable Finite-Element Viscoelastic Crustal Deformation Analysis Accelerated with Data-Driven Method2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Extreme Scale Earthquake Simulation with Uncertainty Quantification2022

Author(s)

Journal Title

DOI

Related Report

[Journal Article] Calculation of Cross-correlation Function Accelerated by Tensor Cores with TensorFloat-32 Precision on Ampere GPU2022

Author(s)

Journal Title

DOI

ISBN

Related Report

[Presentation] Compression of Scientific Simulation Data by Stochastic Basis Expansion - Example on Multiple Computer Systems2023

Author(s)

Organizer

Related Report

[Presentation] GPU-accelerated viscoelastic crustal deformation analysis with data-driven method2023

Author(s)

Organizer

Related Report

[Presentation] Finite-Element Seismic Ground Motion Simulation Enhanced with High-Performance Computing2023

Author(s)

Organizer

Related Report

[Presentation] Enhanced Earthquake Simulation with Data-Driven Methods and Stochastic Analysis2022

Author(s)

Organizer

Related Report

[Presentation] 高詳細三次元地盤震動解析手法の開発と，地盤歪のボリュームデータ可視化に関する基礎検討2022

Author(s)

Organizer

Related Report

[Presentation] Seismic Wave Simulation from Earthquake Fault to City with Large-Scale Finite-Element Analysis on Fugaku2022

Author(s)

Organizer

Related Report

[Presentation] 都市の詳細3次元地震シミュレーションのための高速・スケーラブルな有限要素法の開発2022

Author(s)

Organizer

Related Report

藤田航平東京大学, 地震研究所, 准教授 (00744856)