反復型領域分割法は数100万~数億要素の大規模問題に対して有効な並列化手法であり、この並列計算機能をライブラリ化したものを有限要素電磁界解析コードに適用した結果、有効性が示されている。しかし、計算のボトルネックとなる領域間釣り合い問題を求解する共役勾配法(Conjugate Gradient Method : CG法)の収束性は、解析規模が大きくなるほど、また、材料構成が複雑になるほど悪化する。 そこで本研究では、反復型領域分割法の領域間釣り合い問題の収束性改善を目指し、反復解法に擬似4倍精度を導入することを提案する。 まずはじめに「部分領域問題向け擬似4倍精度ソルバーの開発」として106bitの仮数を実現する手法の擬似4倍精度変数を共役勾配法内の各演算に実装した。次に「領域間釣り合い問題の収束性改善」として部分領域問題の反復解法において擬似4倍精度演算を導入することによる反復型領域分割法における領域間釣り合い問題の反復回数の削減効果を確認するためにPCクラスタ20台(80コア)での評価実験を実施した。さらに「メニーコア計算機環境でのスレッド並列化検討」として、コア数64のメニーコア(Xeon Phi KNL)および96GBのメモリ搭載WSをOS・CentOS7.4で構築し、解析コードの並列化を検証する。KNLのハードウェア特性を検証するために、AVX512対応(SIMD)のコンパイラgcc-4.9.4を使用し、CG法の演算に用いられる内積、DAXPY、行列ベクトル積についてOpenMPによるスレッド並列化効果の検証を実施した。 これらの成果として、釣り合い問題の反復解法に渡す各データと、釣り合い問題の反復解法の残差ベクトル計算の精度向上によって収束性改善が示された。また、KNLハードウェア特性検証までは確認できたが、解析コードのスレッド並列化ならびに最適化適用は今後の課題である。
|