研究概要 |
本研究はGPUスパコンにおける3倍・4倍精度演算の実用化を目的に, GPUに対応した高性能な3倍・4倍精度線形計算ライブラリ実現のための基礎研究として, (1)3倍・4倍精度演算手法の改良, (2)複数精度に対応した線形計算ライブラリの実装, (3)疎行列計算への適用, の3つのテーマについて研究を行う計画としている. 本年度は主として「(3)疎行列計算への適用」に関する研究として, GPUにおける4倍精度浮動小数点演算の疎行列反復解法への応用に関する研究を行った. 疎行列に対する連立一次方程式の反復解法は科学技術計算において多用される重要な演算であるが, 浮動小数点演算の丸め誤差の影響で収束に要する反復回数が増大する場合があり, 高精度の浮動小数点演算によって収束性を改善できるケースがある. 本研究では疎行列反復解法として広く用いられているクリロフ部分空間法(CG法・BiCGStab法)を, 4倍精度浮動小数点演算を用いてGPU上に実装した. 性能評価に用いたNVIDIA Tesla K20c GPUにおいては, 疎行列反復解法において4倍精度演算を行ってもその性能はメモリ律速となり, 一反復当たりの実行時間は最大でも倍精度演算の2倍程度となった. そして倍精度演算のみを用いた場合と比べて4倍精度演算を用いることで反復回数が十分に削減できるようなケースでは, 4倍精度演算を用いることで収束までの計算時間を短縮できるケースが少数であるが見つかった. 本研究はGPU上の疎行列計算において, 4倍精度演算が十分に実用的な性能で実現できることを示し, 4倍精度演算の使用が疎行列反復解法の収束性を改善し高速化するための選択肢の一つとなりうることが示された.
|