研究概要 |
本研究では非構造格子上の代数的マルチグリッド法及び分散共有メモリアーキテクチャ上での線形代数アルゴリズムの効率的な並列実装技術について,以下の成果を得た. マルチグリッド法は異方性問題において収束が劣化する問題点がある.本研究では,smoothed aggregationに基づく代数的マルチグリッド前処理付共役勾配法(AMGCG法)を提案し,256CPU構成のSPARCワークステーションクラスタを用いて最大1562万元の3次元ポアソン方程式をAMGCG法,ICCG法の双方で解き,もっとも大規模な問題では計算時間でICCG法の1/3以下となることを示したさらにアグリゲートを領域境界から生成し,最も粗いレベルで疎行列並列樹辮去を用いることにより,異方性の問題に対しても問題サイズによらずほぼ一定の時間で収束することを示した. これらの研究と平行して,平成13年度にはIntel社製プロセッサを用いた分散共有メモリ型計算機として日本電気(株)製サーバAzusAを,また平成14年度には特定領域研究(2)14019030との連携によりIBM社製サーバx440を導入し,オペレーティングシステムとしてLinuxを利用した計算環境を構築すると共にBLASレベルでの効率的な並列化により,疎行列アルゴリズムにおいて大きな計算量を占める低レベルBLASレベルについて,十分なスケーラビリティが得られることを示した.さらに共有メモリアーキテクチャ上での数値アルゴリズムの効率的な並列実装技術の応用として高速フーリエ変換を取り上げキャッシュを有効利用するとともに分散共有メモリ向けのデータ配置を行うことにより,ピーク性能の12%以上にあたる2GFlops以上の性能を得ることに成功した.
|