研究課題
2019年度は単体のメニーコアプロセッサにおいてSIMD命令を有効活用する高速フーリエ変換(Fast Fourier Transform、以下FFT)アルゴリズムの実装を行った。さらに、Intel Xeon Phiクラスタにおける二次元分割を用いた並列三次元実数FFTの実現と評価を行った。最近のスーパーコンピュータでは、MPIプロセス数が1万個を超える場合もあるが、z軸で一次元分割を行った場合、z軸におけるデータ点数も1万点を超えることになり、三次元FFTの問題サイズに制約が生じることになる。この問題に対処する方法として、二次元分割を用いた並列三次元FFTが提案されている。しかし、Intel Xeon Phiクラスタにおける二次元分割を用いた並列三次元実数FFTの実装はまだ報告されていなかった。そこでIntel Xeon Phiクラスタにおいて二次元分割を用いた並列三次元実数FFTを実装して評価を行った。二次元分割を用いた並列三次元FFTの提案した実装は、離散フーリエ変換(Discrete Fourier Transform)の共役対称性およびrow-column FFTアルゴリズムに基づいている。FFTカーネルはIntel AVX-512命令を用いてベクトル化を行った。性能評価の結果、二次元分割が多数のMPIプロセスに対して通信時間を短縮することによって性能を効果的に改善することを示した。さらに、Intel Xeon Phiクラスタにおいて既存の並列FFTライブラリ(FFTW、P3DFFT)よりも高速に並列三次元実数FFTを計算できることを確認した。また、2019年度に行った研究成果を国際会議等で発表した。
2: おおむね順調に進展している
2019年度の研究成果をまとめた論文を国際会議で発表することができたため。
本研究課題については、今後のエクサスケールシステムの動向も調査しつつ、高速フーリエ変換のアルゴリズムの開発を引き続き推進していく予定である。
2019年度の研究成果を2020年3月に国際会議で発表する予定であったが、国際会議が新型コロナウイルス感染症のために中止になったため、次年度使用額が生じた。この次年度使用額については、2019年度に行う予定であった成果発表で使用する予定である。
すべて 2020 2019
すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) (うち国際学会 1件)
Proc. 13th International Conference on Parallel Processing and Applied Mathematics (PPAM 2019), Part I, Lecture Notes in Computer Science
巻: 12043 ページ: 151-161
10.1007/978-3-030-43229-4_14