2011 年度実績報告書

GPUによるFFT計算の自動チューニング手法の研究

研究課題

研究課題/領域番号	22680002
研究機関	東京工業大学
研究代表者	額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)
キーワード	高速フーリエ変換 / GPU / CUDA / 自動チューニング
研究概要	GPGPUで現在主流となっているのはCUDA環境であるが,NVIDIA製GPUのみを対象としているという制限がある.他のベンダのGPUやメニーコアプロセッサも対象とする共通のプログラム環境の中でCUDAに一番近いものがOpenCLである.OpenCL環境ではCUDAとほぼ同じ機能が提供されており,特にFFTの計算を実行するカーネル部分のコードは似ている.唯一の差異はFFTで利用する三角関数のテープルの扱いで,CUDAではテクスチャメモリを利用していたがOpenCLではコンスタントメモリを使用した.AMD製RADEON HD7970を用いてCUDA+NVIDIA製GPUを超える性能を実現することができた.一方,性能のポータビリティはOpenCLでは確保されていない.NVIDIA製GPUではCUDA版と比べるとOpenCL版の性能は現時点ではかなり劣る.今後ドライバの成熟を待てばこの差は縮まることが期待される. さらに複数GPUへの対応も進めている.特にGPUのデバイスメモリ容量は限られるため,実アプリケーションでは容量を確保するために複数GPUを利用するケースも少なくない.GPU間の転送はPCI-ExpressインターフェイスやInfiniBandなどのノード間インターコネクトの性能に大きく依存し,実行時間の大部分をGPU間のall-to-all通信が占めることになる.CUDAではversion4.0からこのGPU間通信を強化しており,PCI-Expressネットワークを介したGPU問の直接通信や,InfinlBand HCAとの協調動作などがサポートされた.これらの機能を活用することで,通信が全く必要ないシングルGPU実行時と比べても4GPU搭載システムで約2倍,64ノード64GPUのクラスタで最大13倍の性能向上を実現した.通信関連の各種自動最適化は今後の課題である。

研究成果
(7件)

すべて 2012 2011 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (5件) 備考 (1件)

[雑誌論文] スーパーコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成2011
- 著者名/発表者名
  遠藤敏夫, 額田彰, 松岡聡
- 雑誌名
  
  情報処理学会論文誌コンピューティングシステム
  
  巻: Vol.4,No.4 ページ: 169-179
- 査読あり
[学会発表] High Performance 3-D FFT using multiple CUDA GPUs2012
- 著者名/発表者名
  Akira Nukada, Yutaka Maruyama, Satoshi Matsuoka
- 学会等名
  Fifth Workshop on General Purpose Processing using Graphics Processing Units (GPGPU-5)in conjunction with ACM ASPLOS XVII
- 発表場所
  London, UK
- 年月日
  2012-03-03
[学会発表] Peta-scale Phase-Field Simulation for Dendritic Solidification on the TSUBAME 2.0 Supercomputer2011
- 著者名/発表者名
  Takashi Shimokawabe, Takayuki Aoki, Tomohiro Takaki, Akinori Yamanaka, Akira Nukada, Toshio Endo, Naoya Maruyama, Satoshi Matsuoka
- 学会等名
  2011 ACM/IEEE International Conference for High Performance, Networking, Storage, and Analysis (SC'11)
- 発表場所
  Seattle, WA, USA
- 年月日
  2011-11-15
[学会発表] Hamming Color Code for Dense and Robust One-shot 3D Scanning2011
- 著者名/発表者名
  Shuntaro Yamazaki, Akira Nukada, Masaaki Mochimaru
- 学会等名
  2011 British Machine Vision Conference
- 発表場所
  Dundee, Scotland
- 年月日
  2011-08-30
[学会発表] Fast Fourier Transform for AMD GPUs2011
- 著者名/発表者名
  Akira Nukada
- 学会等名
  AMD Fusion Developer Summit 2011
- 発表場所
  Bellevue, WA, USA
- 年月日
  2011-06-15
[学会発表] NVCR : A Transparent Checkpoint-Restart Library for NVIDIA CUDA2011
- 著者名/発表者名
  Akira Nukada, Hiroyuki Takizawa, Satoshi Matsuoka
- 学会等名
  20th Heterogeneity in Computing Workshop (HCW 2011), in conjunction with IEEE IPDPS 2011
- 発表場所
  Anchorage, AK, USA
- 年月日
  2011-05-16
[備考]
- URL
  http://matsu-www.is.titech.ac.jp/~nukada/nufft/

2011 年度 実績報告書

GPUによるFFT計算の自動チューニング手法の研究

研究代表者

額田 彰 東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)

研究成果

[雑誌論文] スーパーコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成2011

著者名/発表者名

雑誌名

[学会発表] High Performance 3-D FFT using multiple CUDA GPUs2012

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Peta-scale Phase-Field Simulation for Dendritic Solidification on the TSUBAME 2.0 Supercomputer2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Hamming Color Code for Dense and Robust One-shot 3D Scanning2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Fast Fourier Transform for AMD GPUs2011

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] NVCR : A Transparent Checkpoint-Restart Library for NVIDIA CUDA2011

著者名/発表者名

学会等名

発表場所

年月日

[備考]

URL

2011 年度実績報告書

額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)