2010 Fiscal Year Annual Research Report

GPUによるFFT計算の自動チューニング手法の研究

Research Project

Project/Area Number	22680002
Research Institution	Tokyo Institute of Technology
Principal Investigator	額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)
Keywords	GPU / 高速フーリエ変換 / CUDA / OpenCL / 自動チューニング
Research Abstract	平成22年度はほぼ当初の計画通りに研究が実施された。既存のFFTコードをライブラリソフトウェアの形態でまとめ、さらにNVIDIA社の最新アーキテクチャであるFermi世代のGPUに対応させることは問題なく完了した。CUDAのバージョンの違いに対処するために、自動チューニング機能によって自動生成されるGPU用プログラム記述に一部修正を加えた。またFermi世代ではGPUメモリにキャッシュ機能が搭載されており、各メモリアクセス時に最適なキャッシュ制御モードを明示的に指定することで高性能を実現している。最初のバージョンのライブラリソフトウェアを9月に一般公開し、その後2回の更新を行っている。現時点では、Fermi世代のGPU、サイズが2のべき乗、単精度浮動小数点数の1次元FFTの全ての条件が揃っている場合には各サイズ毎に手作業でチューニングを行ったコードを用いるNVIDIA社のCUFFTライブラリの方が高速であるが、その他の全ての場合にはNukadaFFTライブラリの方が高速である。以上がCUDA環境に関する実施状況であるが、OpenCL環境に関しても平行して進めている。CUDA版と同様の方法で自動チューニングを行う機能はOpenCLが備えていることを確認した。OpenCLは数々のGPUやメニーコアプロセッサに対して統一されたプログラム記述を可能とはするものの、性能可搬性は一切保証していない。現状で利用可能なコンパイラなどの最適化が強力ではないという問題があるため高性能を実現可能なコードの生成方法を検討している段階である。

Research Products
(5 results)

All 2010 Other

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (2 results) Remarks (2 results)

[Journal Article] CUDAによる高速フーリエ変換2010
- Author(s)
  額田彰
- Journal Title
  
  応用数理
  
  Volume: 第20巻第2号 Pages: 37-43
- Peer Reviewed
[Presentation] NukadaFFT : An Auto-Tuning FFT Library for CUDA GPUs2010
- Author(s)
  Akira Nukada, Satoshi Matsuoka
- Organizer
  NVIDIA GPU Technology Conference 2010
- Place of Presentation
  San Jose, CA, USA
- Year and Date
  20100900
[Presentation] Fast Fourier Transform using CUDA GPUs2010
- Author(s)
  Akira Nukada and Satoshi Matsuoka
- Organizer
  ETHZ-Tokyo Tech Workshop : Computing with GPUs, Cells, and Multicores
- Place of Presentation
  Zurich, Switzerland
- Year and Date
  2010-05-11
[Remarks] 上記Webページにてライブラリソフトウェアを配布
- URL
  http://matsu-www.is.titech.ac.jp/~nukada/nufft/
[Remarks] 9月公開以降、263ダウンロード(3/24時点)

2010 Fiscal Year Annual Research Report

GPUによるFFT計算の自動チューニング手法の研究

Principal Investigator

額田 彰 東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)

Research Products

[Journal Article] CUDAによる高速フーリエ変換2010

Author(s)

Journal Title

[Presentation] NukadaFFT : An Auto-Tuning FFT Library for CUDA GPUs2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Fast Fourier Transform using CUDA GPUs2010

Author(s)

Organizer

Place of Presentation

Year and Date

[Remarks] 上記Webページにてライブラリソフトウェアを配布

URL

[Remarks] 9月公開以降、263ダウンロード(3/24時点)

額田彰東京工業大学, 学術国際情報センター, 産学官連携研究員 (40545688)