実アプリケーションの時空間ブロッキングによる高速化に関する研究

研究課題

研究課題/領域番号	22K17898
研究種目	若手研究
配分区分	基金
審査区分	小区分60090:高性能計算関連
研究機関	名古屋大学
研究代表者	星野哲也名古屋大学, 情報基盤センター, 准教授 (40775946)
研究期間 (年度)	2022-04-01 – 2024-03-31
研究課題ステータス	完了 (2023年度)
配分額 *注記	1,430千円 (直接経費: 1,100千円、間接経費: 330千円) 2023年度: 780千円 (直接経費: 600千円、間接経費: 180千円) 2022年度: 650千円 (直接経費: 500千円、間接経費: 150千円)
キーワード	高性能計算 / ステンシル計算 / 時空間ブロッキング / 自動チューニング / テンポラルブロッキング / 性能モデル
研究開始時の研究の概要	スーパーコンピュータに搭載される最新世代のCPUは大きな共有キャッシュを有し、これを効率的に利用する最適化手法として知られる時空間ブロッキングは、科学・工学分野のシミュレーションで頻出するステンシル計算を高速化するための手法である。しかし時空間ブロッキングは煩雑なプログラミングを要求するため、実アプリケーションへの応用は進んでいない。本研究課題では、比較的簡単なコード変換によって実現可能ながら、大容量の共有キャッシュメモリを用いることで高効率実行が可能なoverlapped方式の時空間ブロッキング手法に着目し、様々なCPUにおける性能モデリング及び実アプリケーションでの有効性の検証を行う。
研究成果の概要	微分方程式を解析的に解く際に生じる時・空間の離散格子に対する特定の計算パターンはステンシル計算と呼ばれ、様々な流体シミュレーションにおいて頻出する重要なカーネルである。ステンシル計算の高速化は盛んに研究されており、時空間ブロッキング手法はその一手法であるが、非常に煩雑なプログラミングを要求するため、実アプリケーションへの適用例はほとんどない。さらに、時空間ブロッキングの性能は実行するプロセッサの性能パラメータに大きく依存するため、人手によって最適化することは現実的ではない。そこで本研究では時空間ブロッキングの自動最適化に必要な性能モデリングを、最新のCPUを用いて行った。
研究成果の学術的意義や社会的意義	本研究では、主にHigh Bandwidth Memory（HBM）を搭載した最新のCPUである、富岳スパコンのA64FXや、Intel Xeon Sapphire Rapids世代のCPUを用いて、性能モデル化を進めた点に大きな価値がある。時空間ブロッキング手法はその性質上、特にメインメモリの性能とラストレベルキャッシュの性能比に性能が大きく依存する。この性能比はHBMの登場によって既存のCPUと大きく変化し、本研究では性能モデルによってその影響を明らかにしたことが、高性能計算分野において意義のある成果である。また当初想定していなかった、命令レイテンシの影響を明らかにした点も意義がある。

報告書

(3件)

2023 実績報告書研究成果報告書 ( PDF )
2022 実施状況報告書

研究成果
(8件)

すべて 2024 2023 2022

すべて雑誌論文 (3件) (うち査読あり 3件) 学会発表 (5件) (うち招待講演 1件)

[雑誌論文] Optimize Efficiency of Utilizing Systems by Dynamic Core Binding2024
- 著者名/発表者名
  Masatoshi Kawai, Akihiro Ida, Toshihiro Hanawa, Tetsuya Hoshino
- 雑誌名
  
  HPCAsia '24 Workshops: Proceedings of the International Conference on High Performance Computing in Asia-Pacific Region Workshops
  
  巻: none ページ: 77-82
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Auto-tuning Mixed-precision Computation by Specifying Multiple Regions2023
- 著者名/発表者名
  Ren Xuanzhengbo、Kawai Masatoshi、Hoshino Tetsuya、Katagiri Takahiro、Nagai Toru
- 雑誌名
  
  2023 Eleventh International Symposium on Computing and Networking (CANDAR)
  
  巻: none ページ: 175-181
- DOI
  10.1109/candar60563.2023.00031
- 関連する報告書
  2023 実績報告書
- 査読あり
[雑誌論文] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2022
- 著者名/発表者名
  Hoshino Tetsuya、Ida Akihiro、Hanawa Toshihiro
- 雑誌名
  
  2022 IEEE International Conference on Cluster Computing (CLUSTER)
  
  巻: 2022 ページ: 462-472
- DOI
  10.1109/cluster51413.2022.00056
- 関連する報告書
  2022 実施状況報告書
- 査読あり
[学会発表] OpenACCを用いた地震シミュレーションのGPU並列化2024
- 著者名/発表者名
  百武尚輝，星野哲也，小澤　創，伊田明弘，安藤亮輔，河合直聡，永井　亨，片桐孝洋
- 学会等名
  情報処理学会全国大会
- 関連する報告書
  2023 実績報告書
[学会発表] HPCカーネルベンチマークによるSapphire Rapids HBMの性能評価2024
- 著者名/発表者名
  星野哲也 , 河合直聡 , 伊田明弘 , 塙敏博 , 片桐孝洋
- 学会等名
  研究報告ハイパフォーマンスコンピューティング（HPC）
- 関連する報告書
  2023 実績報告書
[学会発表] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2023
- 著者名/発表者名
  Tetsuya Hoshino, Akihiro Ida, Toshihiro Hanawa
- 学会等名
  Japan Geoscience Union Meeting 2023
- 関連する報告書
  2023 実績報告書
- 招待講演
[学会発表] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2023
- 著者名/発表者名
  Tetsuya Hoshino, Akihiro Ida, Toshihiro Hanawa
- 学会等名
  ICIAM
- 関連する報告書
  2023 実績報告書
[学会発表] 分子軌道計算プログラムの性能評価と自動チューニング適用の検討2023
- 著者名/発表者名
  満田晴紀，星野哲也，望月祐志，坂倉耕太，片桐孝洋，大島聡史，永井亨，河合直聡
- 学会等名
  研究報告ハイパフォーマンスコンピューティング（HPC）
- 関連する報告書
  2023 実績報告書

実アプリケーションの時空間ブロッキングによる高速化に関する研究

研究代表者

星野 哲也 名古屋大学, 情報基盤センター, 准教授 (40775946)

1,430千円 (直接経費: 1,100千円、間接経費: 330千円)

報告書

研究成果

[雑誌論文] Optimize Efficiency of Utilizing Systems by Dynamic Core Binding2024

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Auto-tuning Mixed-precision Computation by Specifying Multiple Regions2023

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2022

著者名/発表者名

雑誌名

DOI

関連する報告書

[学会発表] OpenACCを用いた地震シミュレーションのGPU並列化2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] HPCカーネルベンチマークによるSapphire Rapids HBMの性能評価2024

著者名/発表者名

学会等名

関連する報告書

[学会発表] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2023

著者名/発表者名

学会等名

関連する報告書

[学会発表] 分子軌道計算プログラムの性能評価と自動チューニング適用の検討2023

著者名/発表者名

学会等名

関連する報告書

星野哲也名古屋大学, 情報基盤センター, 准教授 (40775946)