研究課題
本研究では,スーパーコンピュータ等の超並列アーキテクチャを対象に,計算精度の高精度化と,計算結果の再現性を保証可能で,かつ従来手法と比べて高性能を達成可能な,基本線形代数演算ライブラリ(いわゆるBasic Linear Algebra Subprograms, BLAS)の開発を行う.本研究では次の4つの手法:(1)尾崎スキー ム,(2)ExBLASスキーム,(3)DotKスキーム,(4)CADNAスキームに着目し,この中で(1)を主たる手法として検討する.2022年度は昨年度後半の成果であった,尾崎スキームとDotKスキーム(Dot2)を組み合わせることで無限精度の内積・疎行列ベクトル積を高速化する方法について,CPU/GPU実装の高速化を実施し,国際会議におけるポスター発表(ISC2022),論文発表(PPAM2022)等を行った.本研究を総括すると,まず主目的であった尾崎スキームによる高精度かつ再現可能なBLASの高性能実装を開発し,DotKスキームと組み合わせたさらなる高速化法を提案し,疎行列ソルバーへの適用によって応用が示された.また既存のExBLASスキームによる疎行列ソルバーに対する優位性も示された.さらに派生として尾崎スキームの応用による,低精度演算器(Tensor Cores)を用いた単精度/倍精度行列積の実装,そして単精度/倍精度行列積によるbinary128型4倍精度行列積の実装を提案した.また本研究を基課題とする科学研究費助成事業 国際共同研究加速基金(国際共同研究強化(A))#20KK0259が採択され,2022年度より実施の運びとなった.本研究での探究が不十分であったCADNAスキーム等に関しては,この枠組みでの継続が期待される.
すべて 2023 2022
すべて 雑誌論文 (2件) (うち査読あり 1件、 オープンアクセス 1件) 学会発表 (2件) (うち国際学会 2件)
Proc. Parallel Processing and Applied Mathematics (PPAM 2022), Part of the Lecture Notes in Computer Science book series
巻: 13826 ページ: 40~54
10.1007/978-3-031-30442-2_4
日本応用数理学会2022年度年会講演予稿集
巻: - ページ: -