研究概要 |
平成23年度においては,大規模並列環境における数値計算アルゴリズムとして,高速フーリエ変換(FFT),GPUによる3倍精度浮動小数点演算,GPU環境下での固有値ソルバ開発と既存ソルバとの性能評価,そしてBlock Krylovアルゴリズムによる連立一次方程式の求解高速化について研究を行った。高速フーリエ変換(FFT)の研究では,Intel AVX命令を用いてFFTカーネル部分の性能を向上させると共に,ブロックSix-Step FFTアルゴリズムを用いることで,データがキャッシュに収まらない場合にも高い性能を維持するFFTライブラリFFTEを実装した。GPUによる3倍精度浮動小数点演算についての研究では,3倍精度数を倍精度数と単精度数に分けて格納するDouble+Single型3倍精度型(D+S型)およびD+S型3倍精度演算:(D+S型演算)を提案し,GPUにより3倍精度のBLASルーチンを実装して,その性能をTesla C2050で評価した。その結果,Tesla C2050では3倍精度AXPYがCUBLASの倍精度AXPYの約1.57倍の実行時間,3倍精度GEMVが倍精度GEMVの約1.69倍の実行時間となり,それぞれ4倍精度ルーチンよりも高速な性能を示した。GPU環境下での固有値ソルバ開発と既存ソルバとの性能評価の研究では,開発した固有値ソルバEigen-sgが既存のGPGPUソフトウェアであるMAGMAライブラリに比べてTesla C2050上で高速であることが分かった。Block Krylovアルゴリズムによる連立一次方程式の求解高速化についての研究では,Block BiCGGR法の数値的不安定性の原因解析を行い,同法の残差行列を直交化することで安定したBlock BiCGGRRO法を構築した。これらの研究成果は,ペタフロップスを超える性能を持つ次世代のスーパーコンピュータにおいて,実アプリケーションの高速化に貢献できることが期待される。
|