平成28年度にはFMMのH行列への拡張とH行列によるLU分解コードの開発を行った。この際、exaFMMで採用しているdual tree traversalをH行列のadmissibilityの判定に用いることでタスクベースの並列化を容易に行うことができた。平成29年度には内部カーネルのチューニングと実アプリケーションによるmultigrid法との比較を行った。Batched MAGMAを採用することにより小規模な行列をGPU上で高速に処理することができた。Multigrid法に対する優位性は行列の条件数に依存し、並列度がますとH行列が優位になることが分かった。
|