• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Research-status Report

超並列計算環境のための高精度かつ再現性のある行列計算ライブラリの開発

Research Project

Project/Area Number 19K20286
Research InstitutionInstitute of Physical and Chemical Research

Principal Investigator

椋木 大地  国立研究開発法人理化学研究所, 計算科学研究センター, 研究員 (90742289)

Project Period (FY) 2019-04-01 – 2022-03-31
Keywords高精度 / 再現性 / 行列計算 / BLAS
Outline of Annual Research Achievements

本研究の目的は数値計算における計算の高精度化および再現性の保証を実現し,かつ最先端の超並列計算機アーキテクチャにおいて高性能を実現できるBLASライブラリの開発を行うことである.本研究では4つの手法:(1)尾崎スキーム,(2)ExBLASスキーム,(3)DotKスキーム,(4)CADNAスキームに着目し,このうち(1)を主たる手法として検討する.
2019年度は主として(1)(4)に関する進捗が得られた.(1)に関してはCPU・GPU向けのBLASの基本ルーチンを開発し,オープンソースソフトウェアとして公開した.またこれらに関する査読付き論文を国際学会(PPAM2019)において発表した.さらにその応用として,疎行列反復解法(CG法)への適用,FP16の活用に関する研究を前倒しして実施した(これらは当初2021年度の実施を予定していた).このうち後者については,FP16/32の混合精度ハードウェアであるTensor Coresを活用して高速に高精度・再現性のある実装を行う方法を開発し,査読付き論文が国際学会(ISC2020)に採択された.また(4)CADNAスキームについては,その開発元であり共同研究を進めているソルボンヌ大学側で新しい手法が考案され,共著者として参加した論文を国際学会に投稿した(プレプリント公開済み,現在査読中).
一方,計算結果の精度を担保しながら数値計算に用いられる演算精度を最適化して計算の高速化,省電力化を実現する方法の研究を開始した.本科研費課題で取り組む上記(1)-(4)の手法はその要素技術となりうるため,本研究の応用として位置付けられる.これに関しては本年度は国際会議(SC19)での査読付きポスター発表を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

当初の研究計画と予定が前後しているが,前述の実績を踏まえると総じて十分な進捗があると言える.

Strategy for Future Research Activity

(1)尾崎スキームに関しては,2019年度に実施したCG法への応用に関する論文を執筆中であり,2020年度中に国際学会へ論文投稿する予定である.また分散並列版の実装を開始する.(2)ExBLASスキームに関しては同スキーム開発者らがCG法の実装を行っており,尾崎スキームとの比較を行うことを検討している.またExBLASの最適化されたCUDA実装に関して共同研究を予定している.(3)DotKスキームについてはCPU版の実装を開始するとともに,分散並列版の実装を開始する.(4)CADNAスキームについては前年度新しく提案された手法を具体的な数値計算に適用して実用性の評価を行う.

Causes of Carryover

次年度使用額は5000円以下であり本年度予算は概ね予定通り執行されたと言える.

  • Research Products

    (17 results)

All 2020 2019 Other

All Int'l Joint Research (1 results) Journal Article (4 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 2 results,  Open Access: 1 results) Presentation (12 results) (of which Int'l Joint Research: 10 results)

  • [Int'l Joint Research] Sorbonne University(フランス)

    • Country Name
      FRANCE
    • Counterpart Institution
      Sorbonne University
  • [Journal Article] DGEMM using Tensor Cores, and Its Accurate and Reproducible Versions2020

    • Author(s)
      Daichi Mukunoki, Katsuhisa Ozaki, Takeshi Ogita, Toshiyuki Imamura
    • Journal Title

      ISC High Performance 2020

      Volume: - Pages: -

    • Peer Reviewed
  • [Journal Article] Reproducible BLAS Routines with Tunable Accuracy Using Ozaki Scheme for Many-core Architectures2020

    • Author(s)
      Daichi Mukunoki, Takeshi Ogita, Katsuhisa Ozaki
    • Journal Title

      13th International Conference on Parallel Processing and Applied Mathematics (PPAM2019), Lecture Notes in Computer Science

      Volume: 12043 Pages: 516-527

    • DOI

      10.1007/978-3-030-43229-4_44

    • Peer Reviewed
  • [Journal Article] Can we avoid rounding-error estimation in HPC codes and still get trustful results?2020

    • Author(s)
      Fabienne Jezequel, Stef Graillat, Daichi Mukunoki, Toshiyuki Imamura, and Roman Iakymchuk
    • Journal Title

      Hyper Articles en Ligne

      Volume: hal-02486753 Pages: -

    • Open Access / Int'l Joint Research
  • [Journal Article] Numerical Reproducibility based on Minimal-Precision Validation2019

    • Author(s)
      Toshiyuki Imamura, Daichi Mukunoki, Fabienne Jezequel, Stef Graillat, Roman Iakymchuk
    • Journal Title

      Computational Reproducibility at Exascale Workshop (CRE2019)

      Volume: - Pages: -

    • Int'l Joint Research
  • [Presentation] Accurate DGEMM using Tensor Cores2020

    • Author(s)
      Daichi Mukunoki, Katsuhisa Ozaki, Takeshi Ogita, Toshiyuki Imamura
    • Organizer
      HPC Asia 2020 (poster session)
    • Int'l Joint Research
  • [Presentation] Optimizing Precision for High-Performance, Robust, and Energy-Efficient Computations2020

    • Author(s)
      Roman Iakymchuk, Fabienne Jezequel, Stef Graillat, Daichi Mukunoki, Toshiyuki Imamura, Yiyu Tan, Atsushi Koshiba, Jens Huthmann, Kentaro Sano, Norihisa Fujita, Taisuke Boku
    • Organizer
      HPC Asia 2020 (poster session)
    • Int'l Joint Research
  • [Presentation] Minimal-Precision Computing for High-Performance, Energy-Efficient, and Reliable Computations2020

    • Author(s)
      Daichi Mukunoki
    • Organizer
      SIAM Conference on Parallel Processing for Scientific Computing (PP20)
    • Int'l Joint Research
  • [Presentation] Accurate BLAS implementations: OzBLAS and BLAS-DOT22020

    • Author(s)
      Daichi Mukunoki
    • Organizer
      Workshop on Largescale Parallel Numerical Computing Technology (LSPANC 2020 January)
    • Int'l Joint Research
  • [Presentation] Minimal-Precision Computing for High-Performance, Energy-Efficient, and Reliable Computations2020

    • Author(s)
      Daichi Mukunoki
    • Organizer
      Sapporo Winter HPC Seminar 2020
    • Int'l Joint Research
  • [Presentation] Minimal-Precision Computing for High-Performance, Energy-Efficient, and Reliable Computations2019

    • Author(s)
      Daichi Mukunoki, Toshiyuki Imamura, Yiyu Tan, Atsushi Koshiba, Jens Huthmann, Kentaro Sano, Fabienne Jezequel, Stef Graillat, Roman Iakymchuk, Norihisa Fujita, Taisuke Boku
    • Organizer
      SC19 (research poster session)
    • Int'l Joint Research
  • [Presentation] Minimal-Precision Computing for High-Performance, Energy-Efficient, and Reliable Computations2019

    • Author(s)
      Daichi Mukunoki, Toshiyuki Imamura, Yiyu Tan, Atsushi Koshiba, Jens Huthmann, Kentaro Sano, Fabienne Jezequel, Stef Graillat, Roman Iakymchuk, Norihisa Fujita, Taisuke Boku
    • Organizer
      France-Japan-Germany trilateral workshop: Convergence of HPC and Data Science for Future Extreme Scale Intelligent Applications (poster presentation)
    • Int'l Joint Research
  • [Presentation] Accurate and Reproducible Linear Algebra Operations for Many-core Architectures2019

    • Author(s)
      Daichi Mukunoki, Takeshi Ogita, Katsuhisa Ozaki:
    • Organizer
      Russian Supercomputing Days 2019 (RuSCDays 2019) (poster session)
    • Int'l Joint Research
  • [Presentation] 尾崎スキームによる高精度BLAS実装「OzBLAS」とその応用2019

    • Author(s)
      椋木大地, 荻田武史, 尾崎克久
    • Organizer
      第3回 精度保証付き数値計算の実問題への応用研究集会 (NVR 2019)
  • [Presentation] Accurate and Reproducible CG Method on GPUs2019

    • Author(s)
      Daichi Mukunoki, Takeshi Ogita, Katsuhisa Ozaki
    • Organizer
      European Numerical Mathematics and Advanced Applications Conference 2019 (ENUMATH2019)
    • Int'l Joint Research
  • [Presentation] High-Performance Implementations of Accurate and Reproducible BLAS Routines on GPUs2019

    • Author(s)
      Daichi Mukunoki
    • Organizer
      Workshop on Largescale Parallel Numerical Computing Technology (LSPANC 2019 June)
    • Int'l Joint Research
  • [Presentation] 尾崎スキームに基づく高精度かつ再現性のあるBLASルーチンの実装と自動チューニングの適用2019

    • Author(s)
      椋木大地
    • Organizer
      第22回AT研究会オープンアカデミックセッション(ATOS22)

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi