研究課題/領域番号 |
23K11127
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
審査区分 |
小区分60090:高性能計算関連
|
研究機関 | 静岡理工科大学 |
研究代表者 |
幸谷 智紀 静岡理工科大学, 情報学部, 教授 (80319152)
|
研究期間 (年度) |
2023-04-01 – 2026-03-31
|
研究課題ステータス |
交付 (2023年度)
|
配分額 *注記 |
4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2025年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2024年度: 910千円 (直接経費: 700千円、間接経費: 210千円)
2023年度: 2,730千円 (直接経費: 2,100千円、間接経費: 630千円)
|
キーワード | 多倍長精度浮動小数点演算 / 複素線形計算 / 3M法 / LU分解 / 並列化 / OpenMP / SIMD / 多倍長精度計算 / 非線形方程式 / 基本線形計算 / 最適化 |
研究開始時の研究の概要 |
本研究で明らかにしようとしているのは「(1) 混合精度計算による高次悪条件代数方程式の求解法の高速化」と「(2) Chebyschev多項式補間法に基づく超越方程式の求解法の高速化」である。(1)において高速な低精度固有値ソルバーと,高速化した多倍長精度の代数方程式直接解法の組み合わせによる混合精度計算の有用性を確認し,(2)においてより広い超越方程式に適用してどの程度の高精度な近似解を得られるかを実証的に確認する。これらの開発に使用したコードはすべてオープンソースとし,誰もが気軽に使える多倍長精度計算環境のすそ野を広げる。
|
研究実績の概要 |
本研究の目的は,悪条件の非線形方程式を高速に解くために,binary64を超える精度の多倍長浮動小数点演算を組み合わせて実行するための基盤ソフトウェアを充実させるところにある。そのためには既存の多倍長精度線形計算ライブラリより高速な基本線形計算機能(BLAS)を実装する必要があり,我々は既に実BLASの高性能化には成功し,その成果はオープンソースソフトウェアBNCmatmulとして公開している。 研究初年度は,すでに実績のあるこの多倍長精度基本線形計算の機能を充実させることに重点を置いて研究開発を実施した。非線形方程式のうち,代数方程式の求解においては複素演算の高速化が欠かせないが,任意精度演算においては使用しているMPCが既に3M法を用いた複素乗算を用いており,既存の自作多倍長精度複素演算をこれに置き換えることで高速化が達成できるものと思われるが,比較的低精度の固定精度演算(DD, TD, QD精度)にも3M法を適用することでどの程度の線形計算の高速化が図れるのかを,実装とベンチマークテストを行うことで確認した。その結果,ベクトル演算,行列・ベクトル乗算においては3M法の優越性は確認できなかったが,複素密行列乗算においては3つの固定精度演算全てにおいて3M法を用いた実装が高速になることが判明した。続いて複素LU分解も実装し,結果として行列乗算使用による高性能化には限度があるものの一部,特にTD精度においては通常のLU分解よりも高速になる事例が発見できた。結果として従来ライブラリよりも圧倒的に高速な複素線形計算とLU分解の実装を行うことができた。この成果は随時,日本応用数理学会数値解析シンポジウム,情報処理学会HPC研究発表会,ICIAMにおいて口頭発表により公にされており,最終的には査読付き国際会議ICCSA2024のProceedingとして刊行される予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
非線形方程式のうち,代数方程式の求解においては必要となる複素演算の高速化に一定のめどがつき,ベクトル演算,行列・ベクトル乗算,行列乗算に加えてLU分解も全て複素演算に対応した高速なライブラリを構築できたことから,現行の混合精度代数方程式ソルバーの高速化にも十分寄与できる土台ができたと判断している。しかし,実装による高性能化はまだこれからであることから,今のところ初年度の予定通りの進展に留まっている。
|
今後の研究の推進方策 |
混合精度代数方程式ソルバーの機能は,低精度計算による固有値ソルバーの利用と,高精度計算による同時反復法の組み合わせによって実現されている。2年目の研究テーマとしてはこの実装による高性能化の確認が必要となる。今後は,我々の多倍長精度高速線形計算ライブラリBNCmatmulに,今までの知見を盛り込んだ高速化した疎行列・ベクトル乗算を組み込み,これに基づくKrylov部分空間法とLanczos法の実装を行い,3重対角行列を用いた同時反復法に適用することで,多項式の値計算の高速化が可能になるかどうかの確認を行っていきたいと考えている。
|