本研究では、アプリケーション開発者の視点で、GPUスパコン上で高精度が必要な領域をより高精細な格子で計算できる高生産・高性能フレームワークを開発する。本研究では数千台を超えるGPUを搭載したスパコン上で機械学習と通信隠蔽技術により実行時間の最小化を目的とした動的負荷分散技術を確立する。 これを基盤として、 GPUスパコン上で適合細分化格子法(AMR法)を確立し、局所的に100倍の高解像度となる計算を実現することを目指す。この手法を様々なアプリケーションへ適用可能にするGPUスパコンに向けた高性能・高生産AMR法フレームワークを構築する。フレームワークの開発を通して、AMR法の適用技術を確立する。 本年度は、フレームワークが様々な計算手法で有用であることを示すため、前年度までに扱った計算手法とは異なる格子ボルツマン法への対応を進め、フレームワークを高度化した。格子ボルツマン法は時間更新幅が格子幅の定数倍に固定される計算手法である。これに対応するために、異なる時間ステップ幅で効率的にステンシル関数を実行する方法、時間方向への物理量の補間を行う機能などを導入した。これらを用いて、AMR法を適用した格子ボルツマン法計算に成功した。 並行して、大規模計算の性能を向上させるためフレームワークの高度化を行った。動的負荷分散のための領域分割による複雑な幾何形状は、通信量を増加させるとともに、通信のための一時メモリの使用量を増加させ、大規模化の大きな妨げとなっていたため、通信を効率化する領域分割方法を導入した。 当初の計画通り、機械学習による動的負荷分散の最適化の検討およびシミュレーションの予測手法の開発も進めた。研究を進めるにつれAMR法の大規模計算では動的負荷分散よりも各ステップでのGPU間通信のコストが高いことがわかった。このため、新しい領域分割方法の導入などを行い、この削減に注力した。
|