2021 年度実施状況報告書

マルチコアCPU向けに最適化された高速任意精度線形計算ライブラリの開発

研究課題

研究課題/領域番号	20K11843
研究機関	静岡理工科大学
研究代表者	幸谷智紀静岡理工科大学, 情報学部, 教授 (80319152)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	多倍長精度演算 / 基本線形計算 / BLAS / SIMD / AVX2 / OpenMP
研究実績の概要	2021年度は(1)前年度までに達成したSIMD，特にx86_64アーキテクチャCPUでは一般的に使用できるAVX2を用いたマルチコンポーネント型多倍長精度浮動小数点演算(DD(Double-Double), TD(Triple-Double), QD(Quad-Double)及びその派生型(TS(Triple-Single)等)に基づく基本線形計算の高速化の成果を査読付き研究発表論文(ICCSA 2021とARITH 2021)として公表し，更に高みに登るための(2)コンシューマ向けGPU環境における多倍長行列乗算ベンチマークテストと(3)尾崎スキームによる行列乗算の高速化の試みを行った。以下(1)～(3)の概要を述べる。 (1)ICCSA2021においてDD(106bit精度), TD(159bit), QD(212bit)精度の行列乗算をAVX2によって高速化できることを，OpenMPによる並列化を行ったブロック化行列乗算，Strassen行列乗算に対してベンチマークテストを行って示した。またARITH2021においてAVX2を用いたLU分解が高速であることも示した。 (2)コンシューマ向けNVIDIAグラフィックスカード上でCUDAを用いたTS(72bit)精度行列乗算の実装を行い，binary64精度演算を超える高精度かつ高速化が実現できることを示した。 (3)尾崎スキームを用いたTD精度演算の実装を行い，CPU上では現状最も高速なAVX2化したStrassen行列乗算より高速に実行できることをベンチマークテストで示した。しかしGPU上では尾崎スキームが有効に働かず，少なくともcuBLASのSGEMMを用いる限り，ブロック化行列乗算よりも低速にとどまることが判明した。
現在までの達成度 (区分)	現在までの達成度 (区分) 1: 当初の計画以上に進展している理由もともと本計画はマルチコアCPU向けの多倍長精度基本線形計算の高速化が目的であり，2020年度にはの成果をx86_64アーキテクチャCPU上においてAVX2を用いて達成し，2021年度には査読付き国際研究集会論文として発表することができ，また，直接法におけるLU分解も高速化できることも同じく国際研究論文として発表することができた。この時点で当初の目標通り進んでいる。加えて，当初予定にはなかったコンシューマ向けGPU上におけるマルチコンポーネント型多倍長精度基本線形計算の実装も，本研究室所属の修士課程在籍学生の助力によって実現でき，尾崎スキームの有効性と限界についての所見を得ることができた。従って，研究課題においては予定以上の成果を上げることができていると言える。
今後の研究の推進方策	今までの多倍長精度基本線形計算の最適化は全て中田真秀（理化学研究所）によるMPLAPACKとの比較しながら行っており，OpenMPによる並列化性能については若干劣るものの，概ね高速な計算が実現できていることが判明している。また，MPFRベースの任意精度基本線形計算においても，C++クラスライブラリを使用しないことで，比較的低精度計算ではオーバーヘッドなく高速な計算が実現できていることが判明している。従って，今後の方向性としては，ライブラリとしての完成度を上げ，2022年度内にGitHubを通じての公開を目指すとともに，Python環境下での使い方などを含めた我々の多倍長精度基本線形計算ライブラリの活用事例を，国内・国外の研究集会を通じて紹介していくことを予定している。
次年度使用額が生じた理由	コロナ禍によって海外渡航が不可能になり，予定していた海外渡航費用が不要になったことが主な原因である。本年度は国際研究集会への直接参加が可能になると予想されるので，機会が許せば直接参加を行うとともに，論文査読のための費用等に充当したいと考えている。

研究成果
(6件)

すべて 2021

すべて雑誌論文 (3件) (うち国際共著 2件、査読あり 2件) 学会発表 (3件)

[雑誌論文] Acceleration of Multiple Precision Matrix Multiplication Based on Multi-component Floating-Point Arithmetic Using AVX22021
- 著者名/発表者名
  Kouya Tomonori
- 雑誌名
  
  Lecture Notes in Computer Science
  
  巻: 12953 ページ: 202～217
- DOI
  10.1007/978-3-030-86976-2_14
- 査読あり / 国際共著
[雑誌論文] Acceleration of LU decomposition supporting double-double, triple-double, and quadruple-double precision floating-point arithmetic with AVX22021
- 著者名/発表者名
  Kouya Tomonori
- 雑誌名
  
  2021 IEEE 28th Symposium on Computer Arithmetic (ARITH)
  
  巻: 2021 ページ: 54～61
- DOI
  10.1109/ARITH51176.2021.00021
- 査読あり / 国際共著
[雑誌論文] AVX2を用いたPythonプログラミング環境における多倍長精度線形計算高速化の試み2021
- 著者名/発表者名
  幸谷智紀
- 雑誌名
  
  静岡理工科大学紀要
  
  巻: 29 ページ: 49-56
[学会発表] AVX2を用いたマルチコンポーネント型多倍長精度直接法の性能評価2021
- 著者名/発表者名
  幸谷智紀
- 学会等名
  第180回HPC研究会(SWoPP 2021)
[学会発表] GPU における 3 倍精度浮動小数点数演算 (Triple-Single) の性能評価2021
- 著者名/発表者名
  打桐大雅, 幸谷智紀
- 学会等名
  電気・電子・情報関係学会東海支部連合研究発表会
[学会発表] コンシューマ向けGPUを用いた3倍精度(Triple-Single)行列積の性能評価2021
- 著者名/発表者名
  打桐大雅, 幸谷智紀
- 学会等名
  第182回HPC研究発表会

2021 年度 実施状況報告書

マルチコアCPU向けに最適化された高速任意精度線形計算ライブラリの開発

研究代表者

幸谷 智紀 静岡理工科大学, 情報学部, 教授 (80319152)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] Acceleration of Multiple Precision Matrix Multiplication Based on Multi-component Floating-Point Arithmetic Using AVX22021

著者名/発表者名

雑誌名

DOI

[雑誌論文] Acceleration of LU decomposition supporting double-double, triple-double, and quadruple-double precision floating-point arithmetic with AVX22021

著者名/発表者名

雑誌名

DOI

[雑誌論文] AVX2を用いたPythonプログラミング環境における多倍長精度線形計算高速化の試み2021

著者名/発表者名

雑誌名

[学会発表] AVX2を用いたマルチコンポーネント型多倍長精度直接法の性能評価2021

著者名/発表者名

学会等名

[学会発表] GPU における 3 倍精度浮動小数点数演算 (Triple-Single) の性能評価2021

著者名/発表者名

学会等名

[学会発表] コンシューマ向けGPUを用いた3倍精度(Triple-Single)行列積の性能評価2021

著者名/発表者名

学会等名

2021 年度実施状況報告書

幸谷智紀静岡理工科大学, 情報学部, 教授 (80319152)