本研究の目的は,超並列計算機を対象とした材料非線形ボクセルFEM解法の開発である.そのために,下記の2点について研究を実施し,一定の成果を得た. a) 前年度までに開発と性能確認を終えたMPI通信を組み込んだボクセルFEMコードに対して,Open-MP並列も加えてハイブリッド化を実施した.Intel Xeon E5-2600(2.6GHz)搭載のスパコンFujitsu PRIMERGY CX400(名古屋大学)を用いてMPI/OpenMPハイブリッドの性測計測を行った.ノード内でOpenMPの並列数を増やすと,8並列時で理論性能の6割程度まで性能が低下した.しかし,ノード間のMPI並列を1並列から64並列まで増加させたとき,FlatMPIは9%の性能低下がみられたが,MPI/OpenMPハイブリッド並列の性能低下は7%にとどまった.このことから,さらに並列数を増やしていくと,FlatMPIよりMPI/OpenMPハイブリッド並列の方が良い性能を得られるようになると結論付けられる. b) ボクセルFEMコードのGPU実装について,CUDA FortranによるElement-by-Element方式による疎行列・ベクトル積に対する実装を行った.しかし,CUDA Cに対して7割程度であったので,性能維持のため,疎行列・ベクトル積はCUDA Cのまま,その他の大部分をCUDA Fortranとする混合プログラムを作成した.完成したプログラムの計算時間を元のものと比較したところ,ほぼ同じ速度を得た. c) ボクセルFEMの応用先として,X線CTスキャンと組み合わせ,材料定数の同定やデジタル画像相関についても検討した.
|