2018 Fiscal Year Research-status Report
新しい動的負荷分散を用いたGPUスパコン向け適合細分化格子法フレームワークの開発
Project/Area Number |
17K00165
|
Research Institution | The University of Tokyo |
Principal Investigator |
下川辺 隆史 東京大学, 情報基盤センター, 准教授 (40636049)
|
Project Period (FY) |
2017-04-01 – 2020-03-31
|
Keywords | 適合細分化格子法 / 高性能計算 / 高生産フレームワーク / スーパーコンピュータ / 動的負荷分散 |
Outline of Annual Research Achievements |
本研究では、アプリケーション開発者の視点で、GPUスパコン上で高精度が必要な領域をより高精細な格子で計算できる高生産・高性能フレームワークを開発する。本研究では数千台を超えるGPUを搭載したスパコン上で機械学習と通信隠蔽技術により実行時間の最小化を目的とした動的負荷分散技術を確立する。 これを基盤として、 GPUスパコン上で適合細分化格子法(AMR法)を確立し、局所的に100倍の高解像度となる計算を実現することを目指す。この手法を様々なアプリケーションへ適用可能にするGPUスパコンに向けた高性能・高生産AMR法フレームワークを構築する。フレームワークの開発を通して、AMR法の適用技術を確立する。 本年度においては、動的負荷分散技術および通信削減技術を発展させ、導入することでフレームワークの高度化を進めた。特に、動的負荷分散では、複数の木構造を用いたAMR法データ構造に着目し、木構造を順に辿りデータを割り当てることで、それぞれの木構造が局所的に分布することを活用し、データも局所化し均等に分散させることが可能となった。またカウントダウン方式の時間ブロッキング法を導入することで、ユーザコードの変更なく、GPU間の通信をまとめて実行することが可能となり、性能向上を実現した。本フレームワークを用い3次元の圧縮性流体計算コードで、東京工業大学のTSUBAME3.0の288 GPUを用い、84%の並列化効率を達成した。 フレームワークの適用を目指す流体中を流れ成長する金属凝固成長計算は、流体計算には格子ボルツマン法を用いる。この格子ボルツマン法は時間更新幅が格子幅の定数倍に固定される計算手法であるために、解像度ごとに時間ステップ幅が異なり、時間方向にも物理量の補間が必要となる。この計算を実現できる機構を開発し、AMR法フレームワークへ導入した。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
現在までに、研究計画に示した通り、動的負荷分散手法の開発と複数GPUで実行可能なAMR法フレームワークを構築した。本年度は、特に、動的負荷分散では、複数の木構造を用いたAMR法データ構造に着目し、木構造を順に辿りデータを割り当てることで、それぞれの木構造が局所的に分布することを活用し、データも局所化し均等に分散させることが可能となった。またカウントダウン方式の時間ブロッキング法を導入することで、ユーザコードの変更なく、通信をまとめて実行することが可能となり、性能向上を実現した。昨年度までに開発したAMR法を適用した実アプリケーションで必須となるデータ入出力機構、リスタートファイル作成機能、リダクション計算を簡便に導入する基盤との統合を行い、大規模GPU計算を実現するAMR法フレームワークを構築した。計画を前倒し、有限体積法による流体計算への適用を進め、100台を超えるGPU計算においても高い性能が達成できることを実証した。 流体中を流れ成長する金属凝固成長計算の流体計算部分へフレームワークを適用するため、時間方向にも物理量の補間を可能とする機構を開発し、AMR法フレームワークへ導入した。これを用いて、現在、流体中を流れ成長する金属凝固成長計算に対して本フレームワークの適用を進めている。 当初、機械学習を用いたさらなる動的負荷分散の向上を計画していたが、実行性能の向上のためには動的負荷分散の最適化よりも各時間ステップ中の通信コストを削減する効果が大きいことが判明したため、通信コストの削減にも焦点を当てて研究を進めている。 研究課題全体としては、計画通り進展している。
|
Strategy for Future Research Activity |
大規模にGPUで実行可能なAMR法フレームワークの構築および実アプリケーションを開発する上での周辺技術の開発がほぼ完了したため、今後は、流体中を流れ成長する金属凝固成長計算への本フレームワークの適用を進め、これを完成させることを目指す。まずは流体計算の格子ボルツマン法にAMR法を適用することに注力し、AMR法を適用したフェーズフィールド法とカップリングさせ、これまでに開発した要素技術を統合することで、AMR法を適用した流体中を流れ成長する金属凝固成長を完成させる。 また、並行して、当初の計画通り、機械学習の枠組みを用いた予測型の動的負荷分散手法の開発を進め、構築したAMR法フレームワークとの統合を進めていく。本手法の実現にはシミュレーションを学習し、その結果をシミュレーションすることなく推論する技術の開発が必要である。まず、AMR法よりもデータ構造や計算方法が比較的単純である直交格子上のステンシル計算で、この方法論が有効であることを示す。現在予備検討を進めている。ステンシル計算に対してこの方法を確立したのち、AMR法を適用した計算(凝固成長計算や流体計算など)に適用し、これを推論できる基盤を構築する。 最終的に、高い性能を達成するAMR法を適用した大規模計算を実現することを目指す。
|
Causes of Carryover |
当初、査読あり国際会議での発表を予定していたが、発表に至らず、残額が生じた、翌年度に開催される査読あり国際会議で論文が採択されたため、この旅費および参加費として支出する予定である。
|