強制疎化LU分解は大規模疎行列を係数とする連立一次方程式の高速解法である。本解法はそのベースとなっているLU分解法よりも高速で、並列計算でも有利であると期待される。この点に関し、これまでの研究に引き続いて、本解法を回路過渡解析に用いてその有利性を実証したので、これを国際学会で発表した。しかし本解法はLU分解と同様、計算の構造が複雑で、並列化は必ずしも容易ではない。そこで、ベースとなっている疎行列用LU分解やその他の行列算法の並列計算手法について研究を行なった。本研究はクラスタ計算機に注目しているので、クラスタ計算機における通信・計算性能の評価の研究を現在進めているところである。その際、固有値解法であるヘッセンベルグダブルシフトQR法について効率的な並列化手法を見出した。ヘッセンベルグダブルシフトQR法はn×nの行列に対して並列性が0(n)しかなく、また計算の構造も他の行列計算解法と異なっているため、並列計算の研究はあまり進んでいなかった。これに対して、ソフトウェアパイプライニングと通信遅延の隠蔽を可能とするデータ分割手法を提案した。このデータ分割手法は1ブロックに対するハウスホルダー変換と次のブロックの変換行列の計算をあわせたものを単位ステップの計算とし、この1ステップの計算を均等にプロセッサに割り付けることができる。さらに、1ステップの計算を4つの四半期に分けて計算と通信のタイミングを定義することにより、ほとんどすべての通信に対して1四半期以上の余裕で通信遅延を隠蔽することができることを示した。さらに、本手法とマルチシフトQR法について並列計算時間の評価を行ない比較を行なっており、これについて現在論文を作成中である。ここから得られた各種の知見は、強制疎化LU分解の効率的な並列化の研究にも有益なものであると期待される。
|