Acceleration of kernel with random access and data recurrence on many computer architectures
Project/Area Number |
22K12057
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60100:Computational science-related
|
Research Institution | The University of Tokyo |
Principal Investigator |
藤田 航平 東京大学, 地震研究所, 准教授 (00744856)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2022)
|
Budget Amount *help |
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
|
Keywords | ランダムアクセス / データレカレンス / 高性能計算 / 有限要素法 |
Outline of Research at the Start |
計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指す。
|
Outline of Annual Research Achievements |
計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指している。 本年度においては、ランダムアクセス・データレカレンスを多く含むカーネルの一例として、地震シミュレーションに用いられる非構造格子有限要素法におけるマトリクスフリーの行列ベクトル積カーネル(Element-by-Elementカーネル)に注目し、各社で開発が進むCPU・GPUにおけるアルゴリズム開発・性能分析を実施した。CPU/GPU間では計算機アーキテクチャが大きく異なるため最適な計算方法が変わるが、同じCPUやGPUでも種類によってその特性は大きく変わることとなる。そこで、これらの特性をベンチマークで調査しそれぞれのアーキテクチャに適したアルゴリズムを開発した。この研究結果はSCにて併設されるワークショップの一つである2022 Workshop on Accelerator Programming Using Directives (WACCPD)において論文発表した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初計画通り、ランダムアクセス・データレカレンスを多く含むカーネルの一例として、地震シミュレーションに用いられる非構造格子有限要素法におけるマトリクスフリーの行列ベクトル積カーネル(Element-by-Elementカーネル)に対し、各種CPU・GPUにおけるアルゴリズム開発・性能分析を実施し、それぞれのアーキテクチャに適したアルゴリズムを開発し、WACCPDにて論文発表したため。
|
Strategy for Future Research Activity |
本年度においては富岳のA64FX CPU, Intel Xeon CPU, NVIDIA A100, H100 GPUにおいて性能調査・アルゴリズム開発を実施したが、今後はより広い計算機アーキテクチャにおける本手法の適用性、また、必要に応じてアルゴリズム開発を実施していく計画である。また、アルゴリズム拡張によりさらなる性能向上が可能か検討する計画である。
|
Report
(1 results)
Research Products
(9 results)