研究課題/領域番号 |
15K20995
|
研究機関 | 東京工業大学 |
研究代表者 |
下川辺 隆史 東京工業大学, 学術国際情報センター, 助教 (40636049)
|
研究期間 (年度) |
2015-04-01 – 2017-03-31
|
キーワード | ステンシル計算 / 高性能計算 / 高生産フレームワーク / スーパーコンピュータ / 適合細分化格子法 |
研究実績の概要 |
本研究では、アプリケーション開発者の視点で、GPU/CPUスパコン上で高精度が必要な領域をより高精細な格子で計算できる高生産フレームワークを開発する。本研究では数千台を超える GPUを搭載したGPUスパコン上で局所的に高精細に計算できる適合細分化格子法(AMR法)を確立し、局所的に100倍の高解像度計算を実現することを目的とする。この手法を様々なアプリケーションへ適用可能にし、様々なプロセッサで高速に実行可能にするGPU/CPU両対応した高性能・高生産AMRフレームワークを構築する。フレームワークの開発を通して、GPUおよびCPUで高性能な実アプリケーションを高生産に開発する技術を確立することを目指す。本年度においては、ほぼ当初の研究計画通りに、単一のステンシル計算のソースコードをGPUとCPUで高速に実行できるフレームワーク技術を開発した。特に、生産性の高いデータ構造を導入し、実行時パラメータを自動チューニングする機構を導入することで、性能を向上させた。実アプリケーション開発に有効な、ノード間の並列化、データ入出力機構、リダクション計算を簡便に導入する基盤を構築した。本フレームワークを用い、圧縮性流体計算コード、都市気流計算コードの開発を進めた。フレームワークの開発を通して、GPUおよびCPUで高性能な実アプリケーションを高生産に開発する方法についての有益な知見が得られた。AMR法については、単一GPUによる実装を進めており、GPU上のデータを効率的に柔軟に管理するデータ構造を開発した。来年度は、複数GPUによるAMR法の開発を進め、局所的に高精細な計算を実現する。開発したAMR法を本年度構築したフレームワークへ導入し、これを様々なアプリケーションへと適用し、GPUスパコンおよびCPUスパコン上で局所的に高精細にできるAMRアプリケーションの開発技術の確立を目指す。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本年度は、研究計画に示した通り、構造格子フレームワークの構築を行った。フレームワークは、単一のステンシル計算のソースコードをGPUとCPUで高速に実行できる。特に、実行するアーキテクチャに適した生産性の高いデータ構造を導入し、実行時パラメータを自動チューニングする機構を導入することで、高い生産性を保ちながら性能を向上させた。また、ノード間の並列化、データ入出力、リダクション計算を簡便に導入する機構が導入されている。平成28年度に、構造格子フレームワークを様々なアプリケーションへ適用することを計画していたが、それを前倒しして、構築したフレームワークを基盤として、圧縮性流体計算コードおよび都市気流計算コードを開発し、フレームワークの有用性を検証した。研究開始後、シミュレーションの時間方向に通信をまとめて行う計算手法が性能向上に有効であることが判明したため、これをフレームワークへ導入し、さらなる高度化に成功した。また、本年度は、 単一GPUによる適合細分化格子法(AMR法)の開発を進めており、GPU上のデータを効率的に柔軟に管理するデータ構造を開発した。研究計画では、本年度までに単一GPUおよび複数GPUによるAMR法の開発が完成するとしたが、AMR法のデータ構造の複雑さから、AMR法の開発は当初計画よりもやや遅れており、平成28年度も継続して開発を進める。研究課題全体としては、計画通り進展している。
|
今後の研究の推進方策 |
構造格子フレームワークの構築がほぼ完了したため、平成28年度の前半は、本年度からの継続として、凝固成長計算に対して単一GPUおよび複数GPUによる適合細分化格子法(AMR法)の開発を進めていく。並行して、AMR法と本年度構築した構造格子フレームワークを統合することを視野に入れて、AMR法に特有な部分と対象のアプリケーションに固有な部分の切り分けを進めていく。平成28年度後半では、AMR法を適用した凝固成長計算から、AMR法に特有なデータ構造、動的負荷分散の機構、最適化手法を取り出し、AMR法中のステンシル計算に本年度構築した構造格子フレームワークを適用し、全体を統合する。単一コードをGPU/CPUで高速実行するAMR法フレームワークを構築する。大規模計算では、通信の隠蔽が必須で、通信を隠蔽するコードを生成する技術をAMR法へ適合させ導入する。AMR法フレームワーク完成後、凝固成長計算、有限差分法や有限体積法による流体計算、FDTD法による波動計算を扱う実アプリケーションへ適用し、様々な計算で局所的に100倍の高精細を実現し、フレームワークの実行性能や実用性を示す。最終的に、複数の実アプリケーションを東京工業大学のTSUBAME2.5の4,300台のGPUや16,000個のCPUコアを用いて大規模・高性能計算を行う予定である。様々な物理問題で局所的な領域を高精細に計算できる技術を確立することを目指す。
|