研究課題
本研究の目的は数値計算における計算の高精度化および再現性の保証を実現し,かつ最先端の超並列計算機アーキテクチャにおいて高性能を実現できるBLASライブラリの開発を行うことである.本研究では4つの手法:(1)尾崎スキーム,(2)ExBLASスキーム,(3)DotKスキーム,(4)CADNAスキームに着目し,このうち(1)を主たる手法として検討する.2019年度は主として(1)(4)に関する進捗が得られた.(1)に関してはCPU・GPU向けのBLASの基本ルーチンを開発し,オープンソースソフトウェアとして公開した.またこれらに関する査読付き論文を国際学会(PPAM2019)において発表した.さらにその応用として,疎行列反復解法(CG法)への適用,FP16の活用に関する研究を前倒しして実施した(これらは当初2021年度の実施を予定していた).このうち後者については,FP16/32の混合精度ハードウェアであるTensor Coresを活用して高速に高精度・再現性のある実装を行う方法を開発し,査読付き論文が国際学会(ISC2020)に採択された.また(4)CADNAスキームについては,その開発元であり共同研究を進めているソルボンヌ大学側で新しい手法が考案され,共著者として参加した論文を国際学会に投稿した(プレプリント公開済み,現在査読中).一方,計算結果の精度を担保しながら数値計算に用いられる演算精度を最適化して計算の高速化,省電力化を実現する方法の研究を開始した.本科研費課題で取り組む上記(1)-(4)の手法はその要素技術となりうるため,本研究の応用として位置付けられる.これに関しては本年度は国際会議(SC19)での査読付きポスター発表を行った.
2: おおむね順調に進展している
当初の研究計画と予定が前後しているが,前述の実績を踏まえると総じて十分な進捗があると言える.
(1)尾崎スキームに関しては,2019年度に実施したCG法への応用に関する論文を執筆中であり,2020年度中に国際学会へ論文投稿する予定である.また分散並列版の実装を開始する.(2)ExBLASスキームに関しては同スキーム開発者らがCG法の実装を行っており,尾崎スキームとの比較を行うことを検討している.またExBLASの最適化されたCUDA実装に関して共同研究を予定している.(3)DotKスキームについてはCPU版の実装を開始するとともに,分散並列版の実装を開始する.(4)CADNAスキームについては前年度新しく提案された手法を具体的な数値計算に適用して実用性の評価を行う.
次年度使用額は5000円以下であり本年度予算は概ね予定通り執行されたと言える.
すべて 2020 2019 その他
すべて 国際共同研究 (1件) 雑誌論文 (4件) (うち国際共著 2件、 査読あり 2件、 オープンアクセス 1件) 学会発表 (12件) (うち国際学会 10件)
ISC High Performance 2020
巻: - ページ: -
13th International Conference on Parallel Processing and Applied Mathematics (PPAM2019), Lecture Notes in Computer Science
巻: 12043 ページ: 516-527
10.1007/978-3-030-43229-4_44
Hyper Articles en Ligne
巻: hal-02486753 ページ: -
Computational Reproducibility at Exascale Workshop (CRE2019)