研究実績の概要 |
科研費最終年度は次の2つの仕事を完了した。
(1) 在籍していた大学院生と共同で尾崎スキームに基づく行列乗算の実装とその有用性の確認のためのベンチマークテストを精力的に行った。結果として,マルチコンポーネント型固定精度多倍長精度演算(DD(106bits), TD(159bits), QD(212bits))と,任意精度演算MPFR 512bitsまでは,既存実装のStrassen行列乗算よりも高速であることが確認でき,LU分解にも有効であることを実証した。この結果については情報処理学会ACS論文誌に投稿するとともに,LU分解の最適化についてはICCSA2023に投稿し,後者については採録と発表が決定している。 (2) 3年間の成果をまとめたライブラリを構築し,その概要と有用性を(1)の結果と合わせて第188回HPC研究会で発表した。すべてCベースのオープンソースライブラリとなっており,DD, TD, QD精度をネイティブにサポートしており,AVX2向けの最適化をBLAS1~BLAS3までの主要な実線形計算について行い、OpenMP並列化による最適化もなされている。MPFRによる任意精度線形計算も含め,既存のMPBLASよりも高速であることは,科研費研究期間中の研究報告で明らかになっている。なお,本ライブラリの公開については当初4月末を予定していたが,ドキュメント整理に時間を要しており,本年度前半での公開予定となっている。
コロナ禍をはさんでの3年間の研究期間において査読付き国際学会報告が5件あり,MPBLASがサポートしていないTD精度の基本線形計算の実装と有用性と,尾崎スキームが多倍長浮動小数点演算においてどの程度の有用性があるのかを,実装を通じて示すことができたことは,当初の予定外のものであったが,学術的な新規性のある成果と言える。
|