2013 Fiscal Year Annual Research Report
Project Area | Materials Design through Computics: Complex Correlation and Non-equilibrium Dynamics |
Project/Area Number |
22104003
|
Research Institution | University of Tsukuba |
Principal Investigator |
高橋 大介 筑波大学, システム情報系, 教授 (00292714)
|
Co-Investigator(Kenkyū-buntansha) |
多田野 寛人 筑波大学, システム情報系, 助教 (50507845)
今村 俊幸 独立行政法人理化学研究所, 計算科学研究機構, 研究員(移行) (60361838)
|
Project Period (FY) |
2010-06-23 – 2015-03-31
|
Keywords | 大規模並列環境 / 数値計算アルゴリズム |
Research Abstract |
平成25年度においては,大規模並列環境における数値計算アルゴリズムとして,GPUクラスタにおける並列高速フーリエ変換(FFT)の実現と評価,第3世代NVIDIA GPUを用いた高性能固有値ソルバの開発,そしてBlock Krylov 部分空間反復法の精度向上について研究を行った。 GPUクラスタにおける並列FFTの研究では,並列一次元FFTにおいて全対全通信が3回行われることから,CPUとGPU間のデータ転送とノード間のMPI通信をパイプライン化してオーバーラップさせることができるMPIライブラリであるMVAPICH2を用いて実装を行った。 GPUクラスタであるHA-PACSを用いて評価を行った結果,GPU版はCPU版に比べて高い性能を示すことが分かった。 第3世代NVIDIA GPUを用いた高性能固有値ソルバの開発では,新方式によるCUDABLAS関数を組み込んだGPU-BLAS(ASPEN.K2)を使用してこれまでよりも高速なGPU固有値ソルバEigen-Gを開発した。さらに2012年に発表されたNVIDIA社の第三世代コアである「Kepler」を搭載するTesla K20cを導入して, 新規ハイエンドGPU上でのEigen-Gの性能が他の固有値ソルバMAGMA 1.4.1(GPU+CPU併用)やLAPACK 3(マルチコアOpenMP版)と比較しても高性能もしくは同程度であることを確認した。 Block Krylov 部分空間反復法の精度向上の研究では,Block BiCR法で生成される近似解の精度向上を目指し,同法の修正版を構築した。修正Block BiCR法を用いることで,残差ノルムの振動を抑えることができ,かつ他の解法よりも高精度の近似解を得ることができた。 これらの研究成果は,次世代のスーパーコンピュータにおいて,実アプリケーションの高速化に貢献できることが期待される。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
研究の目的のうち,ペタスケール計算環境に向けた並列数値計算アルゴリズムが実現されており,提案する並列数値計算アルゴリズム の高速性が実証されているため。
|
Strategy for Future Research Activity |
本研究課題については,今後ペタスケールおよびエクサスケール計算環境に適したアルゴリズムおよび最適化手法についての知見を得ることを目指して引き続き推進していく予定である。
|