2015 Fiscal Year Research-status Report

大規模・高精細計算を実現するGPU/CPUアプリケーション・フレームワークの開発

Research Project

Project/Area Number	15K20995
Research Institution	Tokyo Institute of Technology
Principal Investigator	下川辺隆史東京工業大学, 学術国際情報センター, 助教 (40636049)
Project Period (FY)	2015-04-01 – 2017-03-31
Keywords	ステンシル計算 / 高性能計算 / 高生産フレームワーク / スーパーコンピュータ / 適合細分化格子法
Outline of Annual Research Achievements	本研究では、アプリケーション開発者の視点で、GPU/CPUスパコン上で高精度が必要な領域をより高精細な格子で計算できる高生産フレームワークを開発する。本研究では数千台を超える GPUを搭載したGPUスパコン上で局所的に高精細に計算できる適合細分化格子法(AMR法)を確立し、局所的に100倍の高解像度計算を実現することを目的とする。この手法を様々なアプリケーションへ適用可能にし、様々なプロセッサで高速に実行可能にするGPU/CPU両対応した高性能・高生産AMRフレームワークを構築する。フレームワークの開発を通して、GPUおよびCPUで高性能な実アプリケーションを高生産に開発する技術を確立することを目指す。本年度においては、ほぼ当初の研究計画通りに、単一のステンシル計算のソースコードをGPUとCPUで高速に実行できるフレームワーク技術を開発した。特に、生産性の高いデータ構造を導入し、実行時パラメータを自動チューニングする機構を導入することで、性能を向上させた。実アプリケーション開発に有効な、ノード間の並列化、データ入出力機構、リダクション計算を簡便に導入する基盤を構築した。本フレームワークを用い、圧縮性流体計算コード、都市気流計算コードの開発を進めた。フレームワークの開発を通して、GPUおよびCPUで高性能な実アプリケーションを高生産に開発する方法についての有益な知見が得られた。AMR法については、単一GPUによる実装を進めており、GPU上のデータを効率的に柔軟に管理するデータ構造を開発した。来年度は、複数GPUによるAMR法の開発を進め、局所的に高精細な計算を実現する。開発したAMR法を本年度構築したフレームワークへ導入し、これを様々なアプリケーションへと適用し、GPUスパコンおよびCPUスパコン上で局所的に高精細にできるAMRアプリケーションの開発技術の確立を目指す。
Current Status of Research Progress	Current Status of Research Progress 2: Research has progressed on the whole more than it was originally planned. Reason 本年度は、研究計画に示した通り、構造格子フレームワークの構築を行った。フレームワークは、単一のステンシル計算のソースコードをGPUとCPUで高速に実行できる。特に、実行するアーキテクチャに適した生産性の高いデータ構造を導入し、実行時パラメータを自動チューニングする機構を導入することで、高い生産性を保ちながら性能を向上させた。また、ノード間の並列化、データ入出力、リダクション計算を簡便に導入する機構が導入されている。平成28年度に、構造格子フレームワークを様々なアプリケーションへ適用することを計画していたが、それを前倒しして、構築したフレームワークを基盤として、圧縮性流体計算コードおよび都市気流計算コードを開発し、フレームワークの有用性を検証した。研究開始後、シミュレーションの時間方向に通信をまとめて行う計算手法が性能向上に有効であることが判明したため、これをフレームワークへ導入し、さらなる高度化に成功した。また、本年度は、単一GPUによる適合細分化格子法(AMR法)の開発を進めており、GPU上のデータを効率的に柔軟に管理するデータ構造を開発した。研究計画では、本年度までに単一GPUおよび複数GPUによるAMR法の開発が完成するとしたが、AMR法のデータ構造の複雑さから、AMR法の開発は当初計画よりもやや遅れており、平成28年度も継続して開発を進める。研究課題全体としては、計画通り進展している。
Strategy for Future Research Activity	構造格子フレームワークの構築がほぼ完了したため、平成28年度の前半は、本年度からの継続として、凝固成長計算に対して単一GPUおよび複数GPUによる適合細分化格子法(AMR法)の開発を進めていく。並行して、AMR法と本年度構築した構造格子フレームワークを統合することを視野に入れて、AMR法に特有な部分と対象のアプリケーションに固有な部分の切り分けを進めていく。平成28年度後半では、AMR法を適用した凝固成長計算から、AMR法に特有なデータ構造、動的負荷分散の機構、最適化手法を取り出し、AMR法中のステンシル計算に本年度構築した構造格子フレームワークを適用し、全体を統合する。単一コードをGPU/CPUで高速実行するAMR法フレームワークを構築する。大規模計算では、通信の隠蔽が必須で、通信を隠蔽するコードを生成する技術をAMR法へ適合させ導入する。AMR法フレームワーク完成後、凝固成長計算、有限差分法や有限体積法による流体計算、FDTD法による波動計算を扱う実アプリケーションへ適用し、様々な計算で局所的に100倍の高精細を実現し、フレームワークの実行性能や実用性を示す。最終的に、複数の実アプリケーションを東京工業大学のTSUBAME2.5の4,300台のGPUや16,000個のCPUコアを用いて大規模・高性能計算を行う予定である。様々な物理問題で局所的な領域を高精細に計算できる技術を確立することを目指す。

Research Products
(8 results)

All 2016 2015

All Journal Article (4 results) (of which Peer Reviewed: 4 results) Presentation (4 results) (of which Int'l Joint Research: 1 results)

[Journal Article] Two-dimensional phase-field study of competitive grain growth during directional solidification of polycrystalline binary alloy2016
- Author(s)
  Tomohiro Takaki, Munekazu Ohno, Yasushi Shibuta, Shinji Sakane, Takashi Shimokawabe, Takayuki Aoki
- Journal Title
  
  Journal of Crystal Growth
  
  Volume: 442 Pages: 14 - 24
- DOI
  doi:10.1016/j.jcrysgro.2016.01.036
- Peer Reviewed
[Journal Article] GPU phase-field lattice Boltzmann simulations of growth and motion of a binary alloy dendrite2015
- Author(s)
  T Takaki, R Rojas, M Ohno, T Shimokawabe, T Aoki
- Journal Title
  
  Materials Science and Engineering
  
  Volume: 84 Pages: 1 - 8
- DOI
  doi:10.1088/1757-899X/84/1/012066
- Peer Reviewed
[Journal Article] GPU-accelerated 3D phase-field simulations of dendrite competitive growth during directional solidification of binary alloy2015
- Author(s)
  S Sakane, T Takaki, M Ohno, T Shimokawabe, T Aoki
- Journal Title
  
  Materials Science and Engineering
  
  Volume: 84 Pages: 1 - 7
- DOI
  doi:10.1088/1757-899X/84/1/012063
- Peer Reviewed
[Journal Article] 接触による粒子間相互作用のGPU計算での近傍探索手法2015
- Author(s)
  渡辺勢也、青木尊之、都築怜理、下川辺隆史
- Journal Title
  
  情報処理学会論文誌コンピューティングシステム
  
  Volume: 8 Pages: 50 - 60
- Peer Reviewed
[Presentation] High-resolution Weather Prediction Code based on High-productivity Framework for Multi-GPU computation2016
- Author(s)
  Takashi Shimokawabe
- Organizer
  2nd Annual Meeting on Advanced Computing System and Infrastructure (ACSI2016)
- Place of Presentation
  九州大学医学部百年講堂
- Year and Date
  2016-01-19
[Presentation] Advanced High-productivity Framework for Stencil Applications on GPU Supercomputers2015
- Author(s)
  Takashi Shimokawabe, Takayuki Aoki and Naoyuki Onodera
- Organizer
  3rd International Workshops on Advances in Computational Mechanics
- Place of Presentation
  KFC Hall & Rooms、両国、東京
- Year and Date
  2015-10-14
- Int'l Joint Research
[Presentation] 自動チューニング機構の導入によるステンシル計算のためのGPUコンピューティング・フレームワークの高度化2015
- Author(s)
  下川辺隆史、青木尊之、小野寺直幸
- Organizer
  日本応用数理学会 2015年年会
- Place of Presentation
  金沢大学角間キャンパス
- Year and Date
  2015-09-11
[Presentation] ステンシル計算のための高生産GPUコンピューティング・フレームワークの高度化2015
- Author(s)
  下川辺隆史
- Organizer
  第20回計算工学講演会
- Place of Presentation
  つくば国際会議場
- Year and Date
  2015-06-08

2015 Fiscal Year Research-status Report

大規模・高精細計算を実現するGPU/CPUアプリケーション・フレームワークの開発

Principal Investigator

下川辺 隆史 東京工業大学, 学術国際情報センター, 助教 (40636049)

Current Status of Research Progress

Reason

Research Products

[Journal Article] Two-dimensional phase-field study of competitive grain growth during directional solidification of polycrystalline binary alloy2016

Author(s)

Journal Title

DOI

[Journal Article] GPU phase-field lattice Boltzmann simulations of growth and motion of a binary alloy dendrite2015

Author(s)

Journal Title

DOI

[Journal Article] GPU-accelerated 3D phase-field simulations of dendrite competitive growth during directional solidification of binary alloy2015

Author(s)

Journal Title

DOI

[Journal Article] 接触による粒子間相互作用のGPU計算での近傍探索手法2015

Author(s)

Journal Title

[Presentation] High-resolution Weather Prediction Code based on High-productivity Framework for Multi-GPU computation2016

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] Advanced High-productivity Framework for Stencil Applications on GPU Supercomputers2015

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] 自動チューニング機構の導入によるステンシル計算のためのGPUコンピューティング・フレームワークの高度化2015

Author(s)

Organizer

Place of Presentation

Year and Date

[Presentation] ステンシル計算のための高生産GPUコンピューティング・フレームワークの高度化2015

Author(s)

Organizer

Place of Presentation

Year and Date

下川辺隆史東京工業大学, 学術国際情報センター, 助教 (40636049)