研究課題/領域番号 |
22K17898
|
研究機関 | 名古屋大学 |
研究代表者 |
星野 哲也 名古屋大学, 情報基盤センター, 准教授 (40775946)
|
研究期間 (年度) |
2022-04-01 – 2024-03-31
|
キーワード | 高性能計算 / テンポラルブロッキング / ステンシル計算 |
研究実績の概要 |
本研究は、特に微分方程式を解く際に頻出する計算パターンのステンシル計算を高速化する手法として知られる、時空間ブロッキングを対象として性能モデリングを構築することが目的である。時空間ブロッキングには冗長計算が必要なoverlapped方式と冗長計算を削減したtrapezoid方式などがあるが、本年度は3次元の拡散方程式プログラムに対してoverlapped(x,y次元)+trapezoid(z次元)のハイブリッドによる時空間ブロッキングの実装を行なった。実装されたプログラムをXeon CPU, A64FXなどで評価を行なっている。Xeon CPUではL1/L2キャッシュの性能から、概ね想定した通りの性能が得られている一方、A64FXではキャッシュ性能以外にも考慮すべき点がいくつかある(演算レイテンシと、それを隠すために必要なパイプライン実行の段数、パイプライン実行に必要なレジスタ数など)ことが分析によりわかってきた。さらに分析を進め、アプリケーション側のパラメータを含め、性能モデルの構築を目指している。 また実アプリケーションとして、気象庁の天気予報シミュレーションプログラムであるasucaへの時空間ブロッキングの適用を検討している。時空間ブロッキングは、キャッシュを有効利用することにより、冗長な計算を許容しつつもメモリへの負荷を下げる手法であるため、メモリ性能を十分に引き出しいてるプログラムでなければ適用効果が見込めないため、時空間ブロッキング適用に向けたasucaの最適化を行なった。最適化の効果により1.5倍程度の高速化が得られたが、時空間ブロッキングの適用には更なる最適化が必要であることが判明した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
2023年1月に、課題代表者が東京大学情報基盤センター助教から名古屋大学情報基盤センター准教授へと転職したことによる予算執行の遅れや、新たに受け持つことになった授業の準備などの影響で、当初計画より実装や実験の準備が遅れている。当初計画では、2022年度中に国内研究会で成果発表を行う予定であったが、成果発表が2023年度にずれ込むこととなったため、やや遅れていると評価した。
|
今後の研究の推進方策 |
今後の方針として、より新しいCPUを用いた性能評価が必要となる。本研究と関連して、学際大規模情報基盤共同利用・共同研究拠点の2023年度課題として「近代的メニーコアシステムにおける性能モデリング手法」に採択されたため、2023年度は京都大学に新たに設置されたHBMメモリを持つXeon CPU等での評価・分析を行い、より多様なプロセッサを用いての性能モデルの開発に取り組む。 また実アプリケーションでの効果の検証を行うため、気象庁プログラムであるasucaの他、地震シミュレーションコード、大気海洋シミュレーションコードなどへも、それぞれの専門家との共同研究により適用を検討したい。
|