研究課題/領域番号 |
16K16064
|
研究機関 | 国立研究開発法人宇宙航空研究開発機構 |
研究代表者 |
宮島 敬明 国立研究開発法人宇宙航空研究開発機構, 航空技術部門, 招聘職員 (90770850)
|
研究期間 (年度) |
2016-04-01 – 2019-03-31
|
キーワード | 高性能コンピューティング / GPGPU / 粒子系シミュレーション / PIC法 / MPS法 / FPGA |
研究実績の概要 |
本年度は、(1)NSRU-Full-PICのFPGA実装と(2)OpenACCを用いた既存プログラムの短TAT(※)なGPU実装の評価・実証を行った。※短TAT:新規物理モデルのコード化から計算結果を得るまでのシミュレーション全体のターンアラウンドタイムを短縮する手法のこと。研究目的の一つ (1)については、慶應義塾大学 天野研究室の大学院生と共に、高速化を阻害する主要因であるRead After Write (RAW) ハザードを解決する手法の提案と実装を行った。具体的には、RAWハザードが発生する割付処理に対してリダクションを用いることでこれを回避した。また、実装には短TATと実用を見据え、高位合成言語OpenCLと高性能コンピューティング向けのFPGAデバイスを用いた。成果として、リダクションの処理時間がXeonに対して約2倍高速化され、消費電力も低減された。この結果は、国際学会や全国大会に投稿・採択された。 (2)については、OpenACCという既存のC/C++,Fortranコードを担TATでGPUに移植する商用APIを利用した。対象プログラムとして、MPS法という粒子系シミュレーションを取り扱った。MPS法は、NSRU-Full-PICと計算上の特性が似ており、より簡単なプログラムなため、評価・実証に適している。MPS法をOpenACCのみを用いてGPUに実装することで、Xeon上で動作するMPIのみを用いたフラット並列な実装に対して41.5倍の高速化、OpenMPを用いたハイブリッド並列な実装に対して5.6倍の高速化を達成した。この結果は、国際学会や全国大会に投稿・採択された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度の当初計画である、NSRU-Full-PICのFPGA実装とGPU実装は、以下の通り、おおむね順調に進展していると考える。 FPGA実装に関しては、当初計画どおり高速化の阻害要因の分析とリダクションによる高速化が完了した。加えて、高位合成OpenCLを用いたFPGAへの短TATなプログラミング環境の評価・検証を開始することができたため、良好に進展していると考える。 GPUへの短TATについては、FPGAと同様にリダクションによるRAWハザードの解決するめどが立ったため、さらなる高速化手法の検討を行っている。また、OpenACCの基礎的な評価・検証が完了したことで、進展は良好であると考える。 短TATのためのコード自動生成手法に関しては、必要な機能や言語設計については、NSRU-Full-PICの開発者と議論した結果、実績のある商用APIを適切な場所に自動配置する方向で研究を進めることとなった。なお、物理モデルを理解したうえでの処理フローの改変などのNSRU-Full-PICの改変は、さらなる検討が必要性を感じたため、来年度も継続して行うこととする。 研究成果の体外発表についても、国内研究会が3本、国際学会が2本(ポスター、口頭発表)に加え、航空宇宙分野のプログラムの並列化を取り扱った国際ワークショップでの口頭発表が決まったため、順調であると考える。
|
今後の研究の推進方策 |
本研究テーマは、大きく(1)NSRU-Full-PICの高速化と(2)物理シミュレーションの短TAT化手法の提案である。 (1)については、高速化を阻害する主要因の解決策が本年度で検討と実装が行えたため、GPUとFPGAへの実用を考慮した実装を行っていく。また、当初計画に記すように、プリフェッチを利用した新たな高速化手法を提案したいと考えている。 (2)については、本年度の議論を踏まえ、商用のOpenACCに対するラッパーのようなものを中心に検討する。
|
次年度使用額が生じた理由 |
当初計画にあった物品購入が品薄のため、大幅に高額であった。次年度に購入を予定している。
|
次年度使用額の使用計画 |
計算機環境(GPU)の整備として、残額を使用する。
|