研究課題/領域番号 |
26280044
|
研究機関 | 京都大学 |
研究代表者 |
中島 浩 京都大学, 学術情報メディアセンター, 教授 (10243057)
|
研究分担者 |
岩下 武史 北海道大学, 情報基盤センター, 教授 (30324685)
|
研究期間 (年度) |
2014-04-01 – 2017-03-31
|
キーワード | 並列処理 / メニーコアプロセッサ / プログラム変換 |
研究実績の概要 |
本研究の柱である以下の3つの高速化要素技法について、具体的なアプリケーションに基づくコード開発を実施した。 (1) cache-awareコード:FDTD法および有限積分法による超音波伝搬解析に対するタイリング手法として、(a)タイルを3次元的に組み合わせて直方体形状を得る手法を実装し、その性能を評価した。また新たに(b)タイルを3次元的に組み合わせるが直方体形状には限定しないものと、(c)タイルにカラーリングを施すことで同期操作を削減するもの、の2つの手法を検討した。PIC法によるプラズマシミュレーションコードのためのcache-awareな粒子ソート法を実装し、大規模並列シミュレーションによってその有効性を確認した。 (2) SIMD化ループ:FDTD法と有限積分法について、(1)のタイリングと組み合わせ条件節を排除したSIMD化ループを実装した。またPIC法によるプラズマシミュレーションコードに対して、間接参照と条件節を排除したSIMD化ループを実装し、大規模並列シミュレーションによってその有効性を確認した。さらに、クリロフ部分空間法のブロック化IC分解前処理の実装についても改良を行った。 (3) 通信遅延隠蔽・削減: PIC法によるプラズマシミュレーションコードを対象として、粒子の境界移動通信回数の削減のための間歇通信コードを、粒子ソートと組み合わせて実装し、大規模並列シミュレーションによって性能を評価した。その結果、メニーコアプロセッサ内でのプロセス並列・スレッド並列の構成比が極めて重要であることが明らかになり、最適な構成比を求めることが新たな課題として見出された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
cache-awareコード、SIMD化ループ、および通信削減の3つの手法を全て組み合わせた、PIC法によるプラズマシミュレーションコードを開発し、大規模並列シミュレーションによってこれらの有効性を実証した。このコードについては、単一ノードでの実装について学術論文1編を発表し、またマルチノード実装についても研究会発表と国際会議への投稿を行った。FDTD法・有限体積法のタイリングについては、研究実績概要の(1)(a)の手法を実装して詳細な評価を行った結果、(1)(b)や(1)(c)の新たな手法について検討する必要性を見出し、現在実装を進めている。通信遅延隠蔽・削減については、PIC法の評価によって新たな課題が見出されたため、これに応じて計算・通信の並行処理の実装を見直す検討を進めている。この他、クリロフ部分空間法のブロック化IC分解処理について、最新の実装に基づいた成果を国際会議で発表した。
|
今後の研究の推進方策 |
要素技法に関する新たな課題、すなわち新たなタイリング手法とプロセッサに割り当てるプロセス・スレッドの構成比最適化について、早急に実装と適用実験を実施する。またこれらはいずれも、タイルの構成法やそれに依存するSIMD化ループの構成法、およびプロセス間通信の最適化法に対して、チューニングすべき実装パラメータの増加をともなうものであるため、最適パラメータ探索空間の飛躍的な拡大に対応する必要がある。したがって当初の計画に沿って自動チューニングの適用を進めつつ、より効率的な探索方法の検討も併せて行う。
|
次年度使用額が生じた理由 |
PIC法によるプラズマシミュレーションコードの評価のための大規模計算資源の確保と、その成果の国際会議発表に関する経費を予定していたが、コード開発に1月末までの期間を要したため、これらを執行できなかった。
|
次年度使用額の使用計画 |
上記の国際会議への投稿は完了しており、採択されれば発表のための経費として執行する。また発表に伴い追加実験が必要となることが想定されるため、そのための大規模計算資源の確保にも使用する。
|