研究概要 |
本研究では,離散化された問題を解く際に必要となる大規模線形反復解法の共有メモリ型並列計算機上への効率的な並列実装を実現し,高性能なライブラリを提供することを目的としている.本年度は,昨年度に購入した並列計算機(Dell Computer社製PowerEdge 6300)を用い,Jacobi-Davidson法とその共有メモリアーキテクチャ上での実装方式について検討・評価した.その結果,共有メモリプログラミング用標準アプリケーションプログラムインタフェース(OpenMP)を用いた要素線形演算レベルでのループ並列化により,共有メモリ型計算機上で高い並列化効率が得られることを実証した. 汎用性の高いライブラリを作成するためには,計算の各要素が適切な単位に関して最適化され,自由に組み合わせ可能であることが望ましい.そこで,本研究では,米Oak Ridge国立研究所で開発された汎用線形計算ライブラリBLASのうち,疎行列アルゴリズムにおいて計算量の大部分を占めるLevel 1(ベクトル間演算),Level 2(行列-ベクトル間演算)ルーチンについてOpenMPを用いた並列化を行い,Sun Enterprise10000などの大規模な共有メモリアーキテクチャ上で性能を評価した.その結果,Level 1 BLASの並列化に関しては,演算の性質による制約が大きく,一定のスレッド数で飽和するものの,Level 2 BLASに関してはほぼ線形な性能向上が得られることが分かった.
|