研究課題/領域番号 |
15K00166
|
研究種目 |
基盤研究(C)
|
配分区分 | 基金 |
応募区分 | 一般 |
研究分野 |
高性能計算
|
研究機関 | 東京大学 |
研究代表者 |
塙 敏博 東京大学, 情報基盤センター, 准教授 (30308283)
|
研究期間 (年度) |
2015-04-01 – 2019-03-31
|
キーワード | FPGA / 演算加速装置 / PCI Express / OpenCL / OpenACC |
研究成果の概要 |
GPUなど演算加速器間の直接通信を実現する密結合演算加速機構TCAアーキテクチャは低遅延通信効果により強スケーリングに有効である。本研究ではTCAの高速通信と演算を融合し、高効率な演算の実現を目的として、feasibility studyを実施した。主に数値計算アルゴリズムを用いて演算加速器向けのプログラムをOpenCLで記述しFPGA論理を生成して性能評価を行った結果、高度なパイプライン化を施すことで高い性能が得られた。OpenACC記述からOpenCLへの自動変換についても試みた。しかし、従来の記述から大幅な修正を行う必要があり、コンパイラによる自動変換は非常に困難であると考えられる。
|
自由記述の分野 |
高性能計算
|
研究成果の学術的意義や社会的意義 |
演算加速器向けのプログラミング言語であるOpenCLを用いたFPGA実装がFeasibleであることを示した。しかしGPUのようにデータ並列の記述では性能が得られず、FPGAのアーキテクチャを考慮し記述する必要がある。OpenCLのカーネルを分割し、パイプライン方式での制御に変更することで行列積については高い性能が得られた。 また、通常のソフトウェア最適化技術と逆行する、冗長な記述や、ループ中での分岐などがFPGAで有効である。 今後に向けた最新インタフェースとして、CPUとキャッシュ一貫性を持つFPGA接続、3次元積層メモリに関して性能確認を行い、現状の各5倍、30倍程度のバンド幅が期待できる。
|