2023年度は複素数上の離散フーリエ変換(Discrete Fourier Transform)を環や体上に一般化した数論変換(Number-Theoretic Transform、以下NTT)の並列化および性能評価を行った。NTTは準同型暗号、多項式の乗算および多倍長数の乗算に用いられている。NTTのカーネルには剰余加算、剰余減算および剰余乗算が含まれている。剰余加算は加算および条件付き減算に置き換えることができる。また同様にして剰余減算は減算および条件付き加算に置き換えることができる。剰余乗算には剰余演算が含まれているが、これは整数除算のために遅い処理となる。しかし、Montgomery乗算を用いることで乗算、加減算およびシフト演算のみで剰余乗算を行えることが知られている。高速フーリエ変換(Fast Fourier Transform、以下FFT)の並列化に適しているfour-step FFTアルゴリズムをNTTに適用し、four-step NTTアルゴリズムを構築した。さらに、剰余乗算にMontgomery乗算を用いるとともに、GPUクラスタにおいてMPIとOpenACCを用いて並列化を行った。NVIDIA H100 PCIe GPUを搭載したGPUクラスタの32ノードにおける性能評価の結果、提案するNTTの実装は745 Gops(giga-operations per second)を超える性能を示した。 また、2023年度に行った研究成果を国際会議で発表した。
|