Project/Area Number |
13J01290
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 国内 |
Research Field |
Software
|
Research Institution | The Institute of Physical and Chemical Research (2014) University of Tsukuba (2013) |
Principal Investigator |
椋木 大地 独立行政法人理化学研究所, 計算科学研究機構, 特別研究員(PD)
|
Project Period (FY) |
2013-04-01 – 2015-03-31
|
Project Status |
Completed (Fiscal Year 2014)
|
Budget Amount *help |
¥2,070,000 (Direct Cost: ¥1,800,000、Indirect Cost: ¥270,000)
Fiscal Year 2014: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2013: ¥900,000 (Direct Cost: ¥900,000)
|
Keywords | GPU / BLAS / 拡張精度 / 4倍精度演算 / 拡張精度演算 / 疎行列 / 線形計算 / 反復解法 |
Outline of Annual Research Achievements |
本研究の目的は,GPUスパコンにおける3倍・4倍精度演算の実用化を目的として,GPUにおける高性能な3倍・4倍精度線形計算ライブラリの実現に向けた基礎研究を行うことであった.本年度は主として,GPUにおける複数の演算精度に対応した線形計算ライブラリの効率的な実装手法に関する研究を行った,その結果として,複数のNVIDIA GPUアーキテクチャに対応した高速な行列ベクトル積ルーチン(GEMV)の実装手法を開発した.本実装ではGPUにおけるプログラムの実行メカニズムをモデル化し,実行効率が最大となるようなスレッドブロックサイズを自動的に決定するオンライン自動チューニングを採用する.これにより既存の実装と比べ,実行環境や問題サイズに依存して生じる性能の変動を防ぎ,常に高い性能を維持できる.本手法は,ある線形計算を行うプログラム(例えばBLASルーチンなど)において演算精度が異なる複数バージョンを実装・最適化する上で有効であると考えられる.またこの他に,4倍精度演算手法の応用として,倍精度演算性能が単精度演算性能の1/32であるNVIDIA社の最新GPUにおいて,ソフトウェアエミュレーションによる疑似倍精度演算を実装し,倍精度行列積ルーチン(DGEMM)においてハードウェア処理による実装を上回る性能が得られることを示した.本年度に開発したGPU向けソフトウェアの一部は,オープンソースのライブラリとしてウェブ上で公開しており,今後も開発を継続する予定である.
|
Research Progress Status |
26年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
26年度が最終年度であるため、記入しない。
|