研究課題
特別研究員奨励費
本研究の目的は,GPUスパコンにおける3倍・4倍精度演算の実用化を目的として,GPUにおける高性能な3倍・4倍精度線形計算ライブラリの実現に向けた基礎研究を行うことであった.本年度は主として,GPUにおける複数の演算精度に対応した線形計算ライブラリの効率的な実装手法に関する研究を行った,その結果として,複数のNVIDIA GPUアーキテクチャに対応した高速な行列ベクトル積ルーチン(GEMV)の実装手法を開発した.本実装ではGPUにおけるプログラムの実行メカニズムをモデル化し,実行効率が最大となるようなスレッドブロックサイズを自動的に決定するオンライン自動チューニングを採用する.これにより既存の実装と比べ,実行環境や問題サイズに依存して生じる性能の変動を防ぎ,常に高い性能を維持できる.本手法は,ある線形計算を行うプログラム(例えばBLASルーチンなど)において演算精度が異なる複数バージョンを実装・最適化する上で有効であると考えられる.またこの他に,4倍精度演算手法の応用として,倍精度演算性能が単精度演算性能の1/32であるNVIDIA社の最新GPUにおいて,ソフトウェアエミュレーションによる疑似倍精度演算を実装し,倍精度行列積ルーチン(DGEMM)においてハードウェア処理による実装を上回る性能が得られることを示した.本年度に開発したGPU向けソフトウェアの一部は,オープンソースのライブラリとしてウェブ上で公開しており,今後も開発を継続する予定である.
26年度が最終年度であるため、記入しない。
すべて 2015 2014 2013
すべて 雑誌論文 (5件) (うち謝辞記載あり 3件、 査読あり 3件) 学会発表 (7件)
Proc. 23rd Euromicro International Conference on Parallel, Distributed, and Network-Based Processing (PDP2015)
巻: なし ページ: 642-650
10.1109/pdp.2015.66
計算工学講演会論文集
巻: 20
40020496105
情報処理学会研究報告:ハイパフォーマンスコンピューティング
巻: 2014-HPC-147 ページ: 1-6
Parallel Processing and Applied Mathematics-PPAM 2013, Part I, LNCS 8384
巻: (印刷中) ページ: 632-642
10.1007/978-3-642-55224-3_59
Computational Science and Its Applications-ICCSA 2013, LNCS 7975
巻: 7975 ページ: 211-223
10.1007/978-3-642-39640-3_15