研究課題
2020年度は二次元分割を用いた並列三次元高速フーリエ変換(Fast Fourier Transform、以下FFT)において演算と通信をオーバーラップした実装と評価をIntel Xeon Phiクラスタ上で行った。1プロセッサ当たりの最適なMPIプロセス数や、演算と通信の最適なオーバーラップの割合を静的に求めることは困難であるため、自動チューニング手法を活用した。性能評価の結果、演算と通信の最適なオーバーラップの割合を求めると共に二次元分割の形状を最適にすることで、性能を効果的に改善できることを示した。さらに、Intel Xeon Phiクラスタにおいて既存の並列FFTライブラリであるFFTWよりも高速に並列三次元FFTを計算できることを確認した。また、倍精度浮動小数点FFTだけでなく整数FFTについても実装の検討を行った。具体的には単体プロセッサにおいて、整数FFTで用いられる複数の乗算剰余演算をSIMD命令であるIntel AVX-512IFMA(Integer Fused Multiply-Add)命令を用いて高速化し、性能評価を行った。52ビット以下のオペランドに対して、Intel AVX-512IFMA命令を用いた実装は、Intel 64およびIntel AVX-512F(Foundation)命令を用いた実装に比べて高速に複数の乗算剰余演算が行えることを示した。また、2020年度に行った研究成果を国際会議等で発表した。
2: おおむね順調に進展している
2020年度の研究成果を国際会議で発表することができたため。
本研究課題については、今後のエクサスケールシステムの動向も調査しつつ、高速フーリエ変換のアルゴリズムの開発を引き続き推進していく予定である。
2020年度の研究成果を2020年9月に国内学会で、2020年7月および2021年3月に国際会議で発表したが、いずれもオンライン開催になったため旅費が不要になり、次年度使用額が生じた。この次年度使用額については、2021年度の研究成果を発表する際に使用する予定である。
すべて 2021 2020
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件)
Proc. 20th International Conference on Computational Science and Its Applications (ICCSA 2020), Part V, Lecture Notes in Computer Science
巻: 12253 ページ: 655-663
10.1007/978-3-030-58814-4_52