2003 Fiscal Year Annual Research Report
非構造多重格子を用いた離散化手法とその効率的な並列実装技術
Project/Area Number |
15607005
|
Research Institution | The University of Tokyo |
Principal Investigator |
小柳 義夫 東京大学, 大学院・情報理工学系研究科, 教授 (60011673)
|
Co-Investigator(Kenkyū-buntansha) |
西田 晃 東京大学, 大学院・情報理工学系研究科, 助手 (60302808)
須田 礼仁 東京大学, 大学院・情報理工学系研究科, 助教授 (40251392)
|
Keywords | 偏微分方程式解法 / 連立一次方程式 / 代数的マルチグリッド法 / 共役傾斜法 / 前処理 / 並列処理 / ベクトル化 / 格納方法 |
Research Abstract |
近年,大規模な線形問題に対して高性能計算機を用いて高速に解く解法が求められている.我々は不規則構造問題にも対応できるスムーズドアグリゲーション代数的マルチグリッド法(SA-AMG)法を対象とし高性能計算環境に効率よく適用できるような解法を提案,実装することを目標とし研究した.高性能計算環境としては多くの場合,計算機クラスタ等,分散メモリ環境として構築されることが多い.また一方でベクトル計算環境ももう一つ別の環境として挙げられる.そこでSA-AMG法の並列化とベクトル化に関する研究を行った. SA-AMG法では,問題行列からサイズの小さい行列を生成し効率よく解く手法であるが,その際に未知数全体を排反な部分集合に分ける.それらはアグリゲートと呼ばれ,サイズの小さい行列の未知数に対応する.並列SA-AMG法の場合,領域分割で実現されるが,領域境界などが影響してアグリゲート生成手法により収束の振る舞いが変り,アグリゲート生成手法についていろいろ研究がなされてきた.本研究では,その一つである独立アグリゲート生成手法について異方性問題に対して,境界からアグリゲート生成を始めると対応できることを示した.また実装として任意のアグリゲート生成手法に対応できるものを示した. 次にベクトル化の研究について示す.我々は不規則な問題にも対応できるSA-AMG法のベクトル化についてNEC SX-6i上で研究を行った.主な計算部分である行列ベクトル積と3疎行列積のベクトル化に対して考察を行った.問題行列の性質によりベクトル化手法が異なるので,本研究では3次元弾性体問題を対象とした.行列ベクトル積に対してはJagged Diagonal Storage(JDS)に基づくものを利用することにより,効率よくベクトル化できた.3疎行列積については,JDSや,Compressed Row Storage(CRS),Compressed Column Storage等を組み合わせて,ベクトル化を試みた.その結果本研究の3次元弾性体問題に対してはJDSとCRSを組み合わせた手法がもっとも高速に処理できた.
|
Research Products
(6 results)
-
[Publications] A.Nishida, Y.Oyanagi: "Performance Evaluation of Low Level Multithreaded BLAS Kernels on Intel Processor based cc-NUMA Systems"Lecture Notes in Computer Science, Vol.2858. 500-510 (2003)
-
[Publications] A.Nukada, A.Nishida, Y.Oyanagi: "Parallel Implementation of FFT Algorithm on Distributed Shared Memory Architecture and its Optimization"IPSJ Transaction on Advanced Computing Systems. Vol.44, No.SIG6. 1-8 (2003)
-
[Publications] A.Fujii, A.Nishida, Y.Oyanagi: "Parallel AMG Algorithm by Domain Decomposition"IPSJ Transaction on Advanced Computing Systems. Vol.44, No.SIG6. 9-17 (2003)
-
[Publications] A.Fujii, A.Nishida, Y.Oyanagi: "Improvement and evaluation of Smoothed Aggregation MG for anisotropic problems"Proceedings of Symposium on Advanced Computing Systems and Infrastructures. 137-144 (2003)
-
[Publications] A.Nukada, A.Nishida, Y.Oyanagi: "Parallel Implementation of FFT Algorithm on Distributed Shared Memory Architecture and its Optimization"Proceedings of High Performance Computing Symposium 2003. 63-70 (2003)
-
[Publications] A.Fujii, A.Nishida, Y.Oyanagi: "Parallel AMG Algorithm by Domain Decomposition"Proceedings of High Performance Computing Symposium 2003. 83-90 (2003)