2010 年度実績報告書

GPUによるFFT計算の自動チューニング手法の研究

研究課題

研究課題/領域番号	22680002
研究機関	東京工業大学
研究代表者	額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)
キーワード	GPU / 高速フーリエ変換 / CUDA / OpenCL / 自動チューニング
研究概要	平成22年度はほぼ当初の計画通りに研究が実施された。既存のFFTコードをライブラリソフトウェアの形態でまとめ、さらにNVIDIA社の最新アーキテクチャであるFermi世代のGPUに対応させることは問題なく完了した。CUDAのバージョンの違いに対処するために、自動チューニング機能によって自動生成されるGPU用プログラム記述に一部修正を加えた。またFermi世代ではGPUメモリにキャッシュ機能が搭載されており、各メモリアクセス時に最適なキャッシュ制御モードを明示的に指定することで高性能を実現している。最初のバージョンのライブラリソフトウェアを9月に一般公開し、その後2回の更新を行っている。現時点では、Fermi世代のGPU、サイズが2のべき乗、単精度浮動小数点数の1次元FFTの全ての条件が揃っている場合には各サイズ毎に手作業でチューニングを行ったコードを用いるNVIDIA社のCUFFTライブラリの方が高速であるが、その他の全ての場合にはNukadaFFTライブラリの方が高速である。以上がCUDA環境に関する実施状況であるが、OpenCL環境に関しても平行して進めている。CUDA版と同様の方法で自動チューニングを行う機能はOpenCLが備えていることを確認した。OpenCLは数々のGPUやメニーコアプロセッサに対して統一されたプログラム記述を可能とはするものの、性能可搬性は一切保証していない。現状で利用可能なコンパイラなどの最適化が強力ではないという問題があるため高性能を実現可能なコードの生成方法を検討している段階である。

研究成果
(5件)

すべて 2010 その他

すべて雑誌論文 (1件) (うち査読あり 1件) 学会発表 (2件) 備考 (2件)

[雑誌論文] CUDAによる高速フーリエ変換2010
- 著者名/発表者名
  額田彰
- 雑誌名
  
  応用数理
  
  巻: 第20巻第2号ページ: 37-43
- 査読あり
[学会発表] NukadaFFT : An Auto-Tuning FFT Library for CUDA GPUs2010
- 著者名/発表者名
  Akira Nukada, Satoshi Matsuoka
- 学会等名
  NVIDIA GPU Technology Conference 2010
- 発表場所
  San Jose, CA, USA
- 年月日
  20100900
[学会発表] Fast Fourier Transform using CUDA GPUs2010
- 著者名/発表者名
  Akira Nukada and Satoshi Matsuoka
- 学会等名
  ETHZ-Tokyo Tech Workshop : Computing with GPUs, Cells, and Multicores
- 発表場所
  Zurich, Switzerland
- 年月日
  2010-05-11
[備考] 上記Webページにてライブラリソフトウェアを配布
- URL
  http://matsu-www.is.titech.ac.jp/~nukada/nufft/
[備考] 9月公開以降、263ダウンロード(3/24時点)

2010 年度 実績報告書

GPUによるFFT計算の自動チューニング手法の研究

研究代表者

額田 彰 東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)

研究成果

[雑誌論文] CUDAによる高速フーリエ変換2010

著者名/発表者名

雑誌名

[学会発表] NukadaFFT : An Auto-Tuning FFT Library for CUDA GPUs2010

著者名/発表者名

学会等名

発表場所

年月日

[学会発表] Fast Fourier Transform using CUDA GPUs2010

著者名/発表者名

学会等名

発表場所

年月日

[備考] 上記Webページにてライブラリソフトウェアを配布

URL

[備考] 9月公開以降、263ダウンロード(3/24時点)

2010 年度実績報告書

額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)