研究概要 |
本研究の目的は,今後さらに出現すると予想されるヘテロジニアス環境において,高速フーリエ変換(fast Fourier Transform,以下FFT)の並列アルゴリズムの実現および評価を行うことである。 科学技術計算に用いられる並列計算機としては,これまで並列スーパーコンピュータが主流であったが,最近はPC(パーソナルコンピュータ)を複数台ネットワークで接続した,いわゆるPCクラスタが価格性能比の点から急速に普及しつつある。 PCにおいては,プロセッサの速度向上が著しく,より高速なプロセッサが数ヶ月毎に発表されている。PCクラスタでは予算の都合等により,ノードを途中で追加するといった状況が生じることがあるが,その時点では,より高速なプロセッサが既に発表されていることも多いことから,この場合一つのPCクラスタの中で異なる速度のプロセッサが存在することになる。 ホモジニアス環境を前提とした従来の並列FFTアルゴリズムをヘテロジニアス環境で実行した場合,速度の遅いプロセッサが速いプロセッサの足を引っ張ることになってしまい,結果として最も速度の遅いプロセッサの速度が各プロセッサの速度ということになる。したがって,ヘテロジニアス環境において高い性能を発揮させるためには,CPUの性能や通信性能などを考慮した上で,アルゴリズムを設計する必要がある。 平成16年度では,同一アーキテクチャでCPU性能が異なるプロセッサからなるPCクラスタを構築し,このPCクラスタ上で並列FFTアルゴリズムを検討した。具体的には,今までに提案してきた,ホモジニアス環境における並列FFTアルゴリズムをもとに,ヘテロジニアス環境においてどのようなデータ分散,スケジューリングおよび通信方法が望ましいかについて研究を行った。 また,平成16年度に行った研究成果を国際会議等で発表すると共に,それらの内容をまとめて学術雑誌等に論文を発表した。
|