研究概要 |
平成22年度においては,大規模並列環境における数値計算アルゴリズムとして,高速フーリエ変換(FFT),GPUによる4倍・8倍精度BLAS,GPUにおける疎行列ベクトル積,CPU+GPU環境上で動作する実対称固有値ソルバ,そしてBlock Krylovアルゴリズムによる連立一次方程式の求解高速化について研究を行うと共に,性能チューニング手法について検討した。高速フーリエ変換(FFT)の研究では,並列三次元FFTにおいて二次元分割により通信時間を削減すると共に,演算と通信をオーバーラップさせることで,従来の実装に比べてさらに性能を改善した。GPUによる4倍・8倍精度BLASを実現し,NVIDIA Tesla C2050において性能評価を行った結果,Intel Core i7 920での同一処理と比べ,4倍精度AXPYが約9.5倍,8倍精度AXPYが約19倍高速化された。GPUにおける疎行列ベクトル積の研究では,疎行列の格納形式を自動選択することで疎行列ベクトル積の高速化を行った。CPU+GPU環境上で動作する実対称固有値ソルバの研究では,予備実験においてIntel SandyBridge CPU+NVIDIA GTX580 GPUの組み合わせで,2000次元の完全対角化が1秒以下で実現された。Block Krylovアルゴリズムによる連立一次方程式の求解高速化についての研究では,複数本のベクトルをまとめて解いた際に右辺ベクトル数が大きくなると,数値的不安定性により残差が発散する場合がある現象について,直交化を施すことで数値的不安定性を抑制でき,相対残差の収束性を改善できた。これらの研究成果は,ペタフロップスを超える性能を持つ次世代のスーパーコンピュータにおいて,実アプリケーションの高速化に貢献できることが期待される。
|