研究課題/領域番号 |
22K12057
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60100:計算科学関連
|
研究機関 | 東京大学 |
研究代表者 |
藤田 航平 東京大学, 地震研究所, 准教授 (00744856)
|
研究期間 (年度) |
2022-04-01 – 2025-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
|
キーワード | ランダムアクセス / データレカレンス / 高性能計算 / 有限要素法 |
研究開始時の研究の概要 |
計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指す。
|
研究実績の概要 |
計算科学アプリケーションにおいて頻繁に現れるランダムアクセス・データレカレンスを含む計算は近年の計算機アーキテクチャとの親和性が低く、多くのアプリケーションの性能ボトルネックとなっている。本研究ではこのようなランダムアクセス・データレカレンスを含むカーネルを対象に、実行パターンに含まれる先見情報を活用し対象とする計算機アーキテクチャの特性を踏まえた計算手法を開発することでCPU/GPUを含む多種の計算機アーキテクチャにおいて高速化を目指している。 本年度においては、昨年度実施した富岳のA64FX CPU, Intel Xeon CPU, NVIDIA GPUに加え、AMD GPUにおける性能評価を進めると共に、ランダムアクセスが主体となる疎行列ベクトル計算自体を連続データアクセスが主体となるデータ駆動型アルゴリズムに変換する開発・GPU実装を実施した。まず、ランダムアクセスを多く含むカーネルの一例として、非構造格子を用いた確率有限要素法における疎行列ベクトル積カーネルに注目し、AMD GPUにおいて性能評価を実施した。当該GPUは比較的キャッシュサイズが小さいため、疎行列計算における節点の並び替えが性能に大きく影響すること、また、AMD GPU特有の倍幅単精度演算器を使うことでさらに高い性能が得られることがわかった。次に、時系列の地震シミュレーションで用いられるランダムアクセスが主体となる疎行列ソルバーにおいて、連続データアクセスが主体となるデータ駆動型手法を用いて高精度な初期解を予測することで、反復法ソルバーの反復数を減らしランダムアクセス計算を削減・計算を高速化する方法をGPU上で開発した。データ駆動型手法と多数ケースの同時計算によるランダムアクセスの削減により、GPUを使った従来手法と比べて8.6倍の高速化を得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
当初計画通り、ランダムアクセスを多く含むカーネルの一例として、地震シミュレーションに用いられる非構造格子有限要素法における行列ベクトル積カーネルに対し、各種計算機におけるアルゴリズム開発・性能分析を実施したため。また、ランダムアクセスの量自体を削減するデータ駆動型アルゴリズムをGPU実装し有効であることを示したため。
|
今後の研究の推進方策 |
これまで数種類のCPU・GPUにおいて性能調査・アルゴリズム開発を実施したが、今後はより広い計算機アーキテクチャにおける本手法の適用性、また、必要に応じてアルゴリズム開発を実施していく計画である。また、アルゴリズム拡張によりさらなる性能向上が可能か検討する計画である。
|