応用プログラムを解析して、そのプログラムを実行するための分散メモリ型並列計算機のネットワーク構成と、並列化された応用プログラムを生成するプログラムについて検討を行い、実際にプログラムを開発するとともにシミュレーションによる評価を行った。 本研究で作成したネットワーク生成システムは、C言語で書かれた応用プログラム、プロセッサ数、1台のプロセッサあたりの接続ポート数を入力としている。入力された応用プログラムは、ループ展開などの前処理の後、各演算を各々のプロセッサに割り当てスケジューリングされる。この時、プロセッサ同士の通信量やプログラムの実行時間を考慮してプロセッサ間のリンクが生成される。さらに再度スケジューリングを行って最適化する。これにより、並列化されたプログラムとプロセッサ同士の接続情報が出力される。ここで生成された接続情報に基づいてプロセッサを接続することで並列計算機が構成される。並列化されたプログラムは、この並列計算機の上で実行される。 SOR法でポアソン方程式を解くプログラムとFFTのプログラムのそれぞれに適用したところ、それぞれのプログラムに応じたネットワーク接続情報が出力された。生成されたネットワークは不規則なものであったが、従来の並列計算機が持っていたトーラスなどの規則的なネットワークを用いるより高速であることがシミュレーションにより確かめられた。さらに実際に検証をするため、CPU、マザーボード、メモリ等を購入し、これらの部品を組み立てた。しかし、FPGAによるネットワークの作製は予定外の費用がかかることになったため断念した。今後、大規模な分散システムでの検証を行うには、さらに展開研究などに発展させることが必要である。
|