研究概要 |
共有メモリ型並列計算機シリコングラフイックス社製Challengeおよび分散共有メモリ型並列計算機富士通社製AP1000で稼働するSPMD(Single Program Multi Data)型の並列プログラムの性能解析し,実行速度を向上させるためのいくつかの知見を得た. (1)従来,配列添字を解析することによって効率良くデータを分割する方法が提案されている.この方法では1つの要素データがデータ転送の単位とされている.しかし,Challengeを含み多くの並列計算機での転送単位はブロックである.そこで,ブロック単位で何度転送が行われるかをプログラムの配列添字式を分析して求め,それに基づきデータ分割の方法を決めることにより,従来方法より並列プログラムが効率のよく稼働することを理論的に示し,また実際に応用プログラムを実行してそれを確認した.また,仮想メモリアドレスから実メモリアドレスを計算するときに使用されるTLB(Translation Look-aside Buffer)へのアクセスもデータへのアクセス同様に性能分析の対象に含めるべきであるという結果を得た. (2)AP1000の全複製による分散共有メモリの効率のよい実現法を考案した.この方法は部分放送という手法を用いる.応用プログラムのリ-ド比率(共有メモリに対するアクセスのうち,readの回数とwriteの回数に関するある比率)を定義し,その値により本提案手法が多くの場合効果的であることを理論的に示した.また,実際に512台のプロセッサをもつAP1000上で実測し,理論値とほぼ一致することを確認した.さらに,通信の一括化による高速化方法を考案し,その効果も確認した. 今後の課題は,これらの提案方法が他のアーキテクチャの並列計算機でどの程度効果があるかを確認することが挙げられる。
|