研究課題/領域番号 |
20K11843
|
研究機関 | 静岡理工科大学 |
研究代表者 |
幸谷 智紀 静岡理工科大学, 情報学部, 教授 (80319152)
|
研究期間 (年度) |
2020-04-01 – 2023-03-31
|
キーワード | 多倍長精度演算 / 基本線形計算 / BLAS / SIMD / AVX2 / OpenMP |
研究実績の概要 |
2021年度は(1)前年度までに達成したSIMD,特にx86_64アーキテクチャCPUでは一般的に使用できるAVX2を用いたマルチコンポーネント型多倍長精度浮動小数点演算(DD(Double-Double), TD(Triple-Double), QD(Quad-Double)及びその派生型(TS(Triple-Single)等)に基づく基本線形計算の高速化の成果を査読付き研究発表論文(ICCSA 2021とARITH 2021)として公表し,更に高みに登るための(2)コンシューマ向けGPU環境における多倍長行列乗算ベンチマークテストと(3)尾崎スキームによる行列乗算の高速化の試みを行った。以下(1)~(3)の概要を述べる。 (1)ICCSA2021においてDD(106bit精度), TD(159bit), QD(212bit)精度の行列乗算をAVX2によって高速化できることを,OpenMPによる並列化を行ったブロック化行列乗算,Strassen行列乗算に対してベンチマークテストを行って示した。またARITH2021においてAVX2を用いたLU分解が高速であることも示した。 (2)コンシューマ向けNVIDIAグラフィックスカード上でCUDAを用いたTS(72bit)精度行列乗算の実装を行い,binary64精度演算を超える高精度かつ高速化が実現できることを示した。 (3)尾崎スキームを用いたTD精度演算の実装を行い,CPU上では現状最も高速なAVX2化したStrassen行列乗算より高速に実行できることをベンチマークテストで示した。しかしGPU上では尾崎スキームが有効に働かず,少なくともcuBLASのSGEMMを用いる限り,ブロック化行列乗算よりも低速にとどまることが判明した。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
もともと本計画はマルチコアCPU向けの多倍長精度基本線形計算の高速化が目的であり,2020年度にはの成果をx86_64アーキテクチャCPU上においてAVX2を用いて達成し,2021年度には査読付き国際研究集会論文として発表することができ,また,直接法におけるLU分解も高速化できることも同じく国際研究論文として発表することができた。この時点で当初の目標通り進んでいる。 加えて,当初予定にはなかったコンシューマ向けGPU上におけるマルチコンポーネント型多倍長精度基本線形計算の実装も,本研究室所属の修士課程在籍学生の助力によって実現でき,尾崎スキームの有効性と限界についての所見を得ることができた。 従って,研究課題においては予定以上の成果を上げることができていると言える。
|
今後の研究の推進方策 |
今までの多倍長精度基本線形計算の最適化は全て中田真秀(理化学研究所)によるMPLAPACKとの比較しながら行っており,OpenMPによる並列化性能については若干劣るものの,概ね高速な計算が実現できていることが判明している。また,MPFRベースの任意精度基本線形計算においても,C++クラスライブラリを使用しないことで,比較的低精度計算ではオーバーヘッドなく高速な計算が実現できていることが判明している。 従って,今後の方向性としては,ライブラリとしての完成度を上げ,2022年度内にGitHubを通じての公開を目指すとともに,Python環境下での使い方などを含めた我々の多倍長精度基本線形計算ライブラリの活用事例を,国内・国外の研究集会を通じて紹介していくことを予定している。
|
次年度使用額が生じた理由 |
コロナ禍によって海外渡航が不可能になり,予定していた海外渡航費用が不要になったことが主な原因である。本年度は国際研究集会への直接参加が可能になると予想されるので,機会が許せば直接参加を行うとともに,論文査読のための費用等に充当したいと考えている。
|