研究概要 |
CPUコアとGPUコアが密に結合されているAPU上で,代数的多重格子法の効率的な実装手法の研究を行った.CPU-GPU間の通信の最小化と,GPUコアは倍精度に対応していないこと,計算性能の効率的利用の観点から,GPUコアで単精度で反復し,CPUコアの上で倍精度に補正する混合精度代数的多重格子法を実装,評価した.その結果,代数的多重格子法において,混合精度手法は有効に機能し,典型的なポアソン問題で収束条件が相対残差の2ノルムで1.0E-7のときに,精度の補正は最大で3回程度で,CPU-GPU間の通信はほとんど発生しないことがわかった.本手法はIvy BridgeやHaswellにも適用可能であり,今後分析を進めて行く予定である.
|