ＧＰＵスパコンのための３倍・４倍精度線形演算ライブラリの開発に関する研究

研究課題

研究課題/領域番号	13J01290
研究種目	特別研究員奨励費
配分区分	補助金
応募区分	国内
研究分野	ソフトウエア
研究機関	独立行政法人理化学研究所 (2014) 筑波大学 (2013)
研究代表者	椋木大地独立行政法人理化学研究所, 計算科学研究機構, 特別研究員(PD)
研究期間 (年度)	2013-04-01 – 2015-03-31
研究課題ステータス	完了 (2014年度)
配分額 *注記	2,070千円 (直接経費: 1,800千円、間接経費: 270千円) 2014年度: 1,170千円 (直接経費: 900千円、間接経費: 270千円) 2013年度: 900千円 (直接経費: 900千円)
キーワード	GPU / BLAS / 拡張精度 / 4倍精度演算 / 拡張精度演算 / 疎行列 / 線形計算 / 反復解法
研究実績の概要	本研究の目的は，GPUスパコンにおける3倍・4倍精度演算の実用化を目的として，GPUにおける高性能な3倍・4倍精度線形計算ライブラリの実現に向けた基礎研究を行うことであった．本年度は主として，GPUにおける複数の演算精度に対応した線形計算ライブラリの効率的な実装手法に関する研究を行った，その結果として，複数のNVIDIA GPUアーキテクチャに対応した高速な行列ベクトル積ルーチン（GEMV）の実装手法を開発した．本実装ではGPUにおけるプログラムの実行メカニズムをモデル化し，実行効率が最大となるようなスレッドブロックサイズを自動的に決定するオンライン自動チューニングを採用する．これにより既存の実装と比べ，実行環境や問題サイズに依存して生じる性能の変動を防ぎ，常に高い性能を維持できる．本手法は，ある線形計算を行うプログラム（例えばBLASルーチンなど）において演算精度が異なる複数バージョンを実装・最適化する上で有効であると考えられる．またこの他に，4倍精度演算手法の応用として，倍精度演算性能が単精度演算性能の1/32であるNVIDIA社の最新GPUにおいて，ソフトウェアエミュレーションによる疑似倍精度演算を実装し，倍精度行列積ルーチン（DGEMM）においてハードウェア処理による実装を上回る性能が得られることを示した．本年度に開発したGPU向けソフトウェアの一部は，オープンソースのライブラリとしてウェブ上で公開しており，今後も開発を継続する予定である．
現在までの達成度 (段落)	26年度が最終年度であるため、記入しない。
今後の研究の推進方策	26年度が最終年度であるため、記入しない。

報告書

(2件)

2014 実績報告書
2013 実績報告書

研究成果
(12件)

すべて 2015 2014 2013

すべて雑誌論文 (5件) (うち謝辞記載あり 3件、査読あり 3件) 学会発表 (7件)

[雑誌論文] Fast Implementation of General Matrix-Vector Multiplication (GEMV) on Kepler GPUs2015
- 著者名/発表者名
  Daichi Mukunoki, Toshiyuki Imamura, Daisuke Takahashi
- 雑誌名
  
  Proc. 23rd Euromicro International Conference on Parallel, Distributed, and Network-Based Processing (PDP2015)
  
  巻: なしページ: 642-650
- DOI
  10.1109/pdp.2015.66
- 関連する報告書
  2014 実績報告書
- 査読あり / 謝辞記載あり
[雑誌論文] NVIDIA GPUにおけるGEMVカーネルの自動チューニング2015
- 著者名/発表者名
  椋木大地，今村俊幸，高橋大介
- 雑誌名
  
  計算工学講演会論文集
  
  巻: 20
- NAID
  40020496105
- 関連する報告書
  2014 実績報告書
- 謝辞記載あり
[雑誌論文] MaxwellアーキテクチャGPUにおける擬似倍精度演算を用いたDGEMMの実装と評価2014
- 著者名/発表者名
  椋木大地，今村俊幸
- 雑誌名
  
  情報処理学会研究報告：ハイパフォーマンスコンピューティング
  
  巻: 2014-HPC-147 ページ: 1-6
- 関連する報告書
  2014 実績報告書
- 謝辞記載あり
[雑誌論文] Using Quadruple Precision Arithmetic to Accelerate Krylov Subspace Methods on GPUs2014
- 著者名/発表者名
  Daichi Mukunoki, Daisuke Takahashi
- 雑誌名
  
  Parallel Processing and Applied Mathematics-PPAM 2013, Part I, LNCS 8384
  
  巻: (印刷中) ページ: 632-642
- DOI
  10.1007/978-3-642-55224-3_59
- ISBN
  9783642552236, 9783642552243
- 関連する報告書
  2013 実績報告書
- 査読あり
[雑誌論文] Optimization of Sparse Matrix-vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs2013
- 著者名/発表者名
  Daichi Mukunoki, Daisuke Takahashi
- 雑誌名
  
  Computational Science and Its Applications-ICCSA 2013, LNCS 7975
  
  巻: 7975 ページ: 211-223
- DOI
  10.1007/978-3-642-39640-3_15
- ISBN
  9783642396397, 9783642396403
- 関連する報告書
  2013 実績報告書
- 査読あり
[学会発表] High-Performance GEMV and SYMV with Auto-Tuning for Performance Stabilization on Multiple GPU Generations2015
- 著者名/発表者名
  Daichi Mukunoki, Toshiyuki Imamura, Daisuke Takahashi
- 学会等名
  GPU Technology Conference (GTC 2015)
- 発表場所
  San Jose (USA)
- 年月日
  2015-03-16 – 2015-03-20
- 関連する報告書
  2014 実績報告書
[学会発表] Kepler・MaxwellアーキテクチャGPUにおける性能が行列形状に依存しない高速なGEMVの実装2015
- 著者名/発表者名
  椋木大地，今村俊幸，高橋大介
- 学会等名
  Annual Meeting on Advanced Computing System and Infrastructure (ACSI 2015)
- 発表場所
  つくば国際会議場（茨城県つくば市）
- 年月日
  2015-01-27
- 関連する報告書
  2014 実績報告書
[学会発表] KeplerアーキテクチャGPUにおける高速なSGEMVの実装2014
- 著者名/発表者名
  椋木大地，今村俊幸，高橋大介
- 学会等名
  GTC Japan 2014
- 発表場所
  東京ミッドタウンホール＆カンファレンス（東京都）
- 年月日
  2014-07-16
- 関連する報告書
  2014 実績報告書
[学会発表] Linear Algebra Operations using Quadruple-precision Arithmetic on GPU2014
- 著者名/発表者名
  Daichi Mukunoki, Daisuke Takahashi
- 学会等名
  GPU Technology Conference (GTC 2014)
- 発表場所
  San Jose, USA
- 年月日
  2014-03-24
- 関連する報告書
  2013 実績報告書
[学会発表] Using Quadruple Precision Arithmetic to Accelerate Krylov Subspace Methods on GPUs2013
- 著者名/発表者名
  Daichi Mukunoki, Daisuke Takahashi
- 学会等名
  10th International Conference on Parallel Processing and Applied Mathematics (PPAM 2013)
- 発表場所
  Warszawa, Poland
- 年月日
  2013-09-10
- 関連する報告書
  2013 実績報告書
[学会発表] GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化2013
- 著者名/発表者名
  椋木大地, 高橋大介
- 学会等名
  2013年並列/分散/協調処理に関する『北九州』サマー・ワークショップ(SWoPP北九州2013)
- 発表場所
  北九州市
- 年月日
  2013-08-02
- 関連する報告書
  2013 実績報告書
[学会発表] Optimization of Sparse Matrix-vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs2013
- 著者名/発表者名
  Daichi Mukunoki, Daisuke Takahashi
- 学会等名
  13th International Conference on Computational Science and Its Applications (ICCSA 2013)
- 発表場所
  Ho Chi Minh City, Vietnam
- 年月日
  2013-06-27
- 関連する報告書
  2013 実績報告書

ＧＰＵスパコンのための３倍・４倍精度線形演算ライブラリの開発に関する研究

研究代表者

椋木 大地 独立行政法人理化学研究所, 計算科学研究機構, 特別研究員(PD)

2,070千円 (直接経費: 1,800千円、間接経費: 270千円)

報告書

研究成果

[雑誌論文] Fast Implementation of General Matrix-Vector Multiplication (GEMV) on Kepler GPUs2015

著者名/発表者名

雑誌名

DOI

関連する報告書

[雑誌論文] NVIDIA GPUにおけるGEMVカーネルの自動チューニング2015

著者名/発表者名

雑誌名

NAID

関連する報告書

[雑誌論文] MaxwellアーキテクチャGPUにおける擬似倍精度演算を用いたDGEMMの実装と評価2014

著者名/発表者名

雑誌名

関連する報告書

[雑誌論文] Using Quadruple Precision Arithmetic to Accelerate Krylov Subspace Methods on GPUs2014

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[雑誌論文] Optimization of Sparse Matrix-vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs2013

著者名/発表者名

雑誌名

DOI

ISBN

関連する報告書

[学会発表] High-Performance GEMV and SYMV with Auto-Tuning for Performance Stabilization on Multiple GPU Generations2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Kepler・MaxwellアーキテクチャGPUにおける性能が行列形状に依存しない高速なGEMVの実装2015

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] KeplerアーキテクチャGPUにおける高速なSGEMVの実装2014

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Linear Algebra Operations using Quadruple-precision Arithmetic on GPU2014

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Using Quadruple Precision Arithmetic to Accelerate Krylov Subspace Methods on GPUs2013

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] GPUにおける4倍精度浮動小数点演算を用いたクリロフ部分空間法の高速化2013

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

[学会発表] Optimization of Sparse Matrix-vector Multiplication for CRS Format on NVIDIA Kepler Architecture GPUs2013

著者名/発表者名

学会等名

発表場所

年月日

関連する報告書

椋木大地独立行政法人理化学研究所, 計算科学研究機構, 特別研究員(PD)