本研究ではスーパーコンピュータ等に採用される超並列アーキテクチャを対象に,計算精度の高精度化と計算結果の再現性を保証可能な,CPUとGPUに対応した基本線形代数演算ライブラリ(いわゆるBasic Linear Algebra Subprograms, BLAS)の開発を行った.本研究では主として尾崎スキームに着目し,高精度かつ再現可能なBLASの高性能実装を開発し,疎行列反復ソルバーへの応用を示した.さらに応用として,低精度演算器(Tensor Cores)を用いた単精度/倍精度行列積の実装,そして単精度/倍精度行列積によるbinary128型4倍精度行列積の実装を提案した.
|