2021 年度実績報告書

余剰コアを活用する高性能計算・データ解析支援

研究課題

研究課題/領域番号	20H00580
研究機関	東京大学
研究代表者	塙敏博東京大学, 情報基盤センター, 教授 (30308283)
研究分担者	下川辺隆史東京大学, 情報基盤センター, 准教授 (40636049) 星野哲也名古屋大学, 情報基盤センター, 准教授 (40775946) 三木洋平東京大学, 情報基盤センター, 助教 (70734375) 伊田明弘国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報基盤センター), 副主任研究員 (80742121)
研究期間 (年度)	2020-04-01 – 2023-03-31
キーワード	高性能計算 / メニーコアプロセッサ / 余剰コア / 計算科学 / 並列処理 / 非同期IO
研究実績の概要	①余剰コアを用いたIn-situ解析として、銀河衝突シミュレーションにおける主計算（重力多体シミュレーションを用いた時間進化の計算）と副計算（数値的に得られた構造と実際に観測されている構造とを比較する解析処理）を同時に処理する機能を実現した。OpenMPのtask指示文を用いることで、プログラムの構造を大きく変えずに実現することができた。本機能の実現により、全体の実行時間は最短で54%になるまで高速化された。 ②分散メモリ計算環境向けにMPI+OpenMP並列化されたアプリケーションに対して、動的な負荷不均衡解消手法の開発を行った。2020年度までに、MPIプロセス毎のコア割当数を制御し、ノード内負荷不均衡を緩和する手法を提案し成果を得ていた。2021年度は、ノード間負荷不均衡の問題に取り組んだ。この問題をNP困難な組合せ最適化問題と捉え、量子アニーリングマシンを用いて解くべく、QUBOモデルへの落とし込みを検討した。 ③複数GPUによるステンシル計算では、GPU間の通信がアプリケーション性能低下につながる。本年度は、GPU計算中にCPUの余剰コアを用いてGPU間通信を行う通信隠蔽手法を開発した。計算領域を複数GPUへどのように分割して割り当てるかが実行性能に大きく影響することがわかり、領域の分割方法を変えながら、性能向上に対する通信隠蔽手法の有効性について検証を行った。 ④冗長な計算を必要とするOverlapped型のテンポラルブロッキングに加え、冗長な計算を必要としないtrapezoid型、及び両者のハイブリッドのテンポラルブロッキングを3次元の拡散方程式に実装し、最新のプロセッサにおいて評価を行った。
現在までの達成度 (区分)	現在までの達成度 (区分) 2: おおむね順調に進展している理由 UTHelperの実現に向けて、In-situ解析処理として、比較的容易な方法で元のプログラムの構造を大きく変えずに主計算と副計算を実現できることを示した。UTHelperが対象とする機能として想定している、非同期ファイルIOやIn-Situ処理については、実アプリケーションに対して容易に機能追加を行うことができることが求められ、実現可能性を示せたことは、アプリケーション作成者に対して有益である。また、OpenMPに加えてMPIプロセスまで含めた負荷不均衡を解消する方法についても検証を進めており、電力あたり性能の改善も得られる見通しである。複数ノードのGPU間通信を効率的に行うためにCPUコアを用いることで通信隠蔽を実現して性能向上が得られており、ステンシル計算において多く用いられるテンポラルブロッキングについても、余剰の演算器を活用して本質的には冗長な計算をあえて行わせることで、メモリに対する負荷を下げ、全体の性能を改善することができている。
今後の研究の推進方策	動的なプロファイリングスレッド数変更に加え、コアの割り当て変更についても外部から動的に行えるよう、OpenMPのランタイムライブラリと連携した動的チューニング機能を実現する。加えて、MPIプロセスと連携した負荷均衡の仕組みも引き続き検討していく。また、最新のIntel Xeon, AMD EPYCを始めとした様々なメニーコア/マルチコアプロセッサを用いて予備評価を行い、主計算の分析と余剰コアの扱い方について検証を行っていく。アプリケーション中で補助機能を簡便に利用できるように、ヘルパースレッドを主計算とはある程度分離された形で実行しつつ、主計算とインタラクションするような機構が必要であり、OpenMP実行環境との整合性を保ちつつ実現する必要がある。併せて、実アプリケーションを用いて、非同期ファイルIOやIn-Situ解析機能に向けた最適な余剰コアの活用方法を検討していく。

研究成果
(5件)

すべて 2022 その他

すべて雑誌論文 (1件) 学会発表 (3件) (うち国際学会 2件、招待講演 2件) 備考 (1件)

[雑誌論文] 余剰コアを活用したOpenMP TaskによるIn-situ解析の実現2022
- 著者名/発表者名
  赤沢龍哉, 塙敏博, 三木洋平
- 雑誌名
  
  情報処理学会研究報告ハイパフォーマンスコンピューティング
  
  巻: 2022-HPC-183 ページ: 1-10
[学会発表] Numerical Evaluation of Dynamic Core Binding Library with H-matrix Application2022
- 著者名/発表者名
  Masatoshi Kawai, Akihiro Ida
- 学会等名
  2022 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
- 国際学会 / 招待講演
[学会発表] メニーコアシステムにおける余剰コア有効利用に向けて2022
- 著者名/発表者名
  塙敏博
- 学会等名
  第28回自動チューニング研究会オープンアカデミックセッション（ATOS28）
- 招待講演
[学会発表] Multi-GPU computing of moving boundary flow using lattice Boltzmann method2022
- 著者名/発表者名
  Akira Hatakeyama, Takashi Shimokawabe
- 学会等名
  International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia) 2022, poster
- 国際学会
[備考] UT-Helper: Support for Utilizing Unused cores
- URL
  https://www.cc.u-tokyo.ac.jp/en/public/sc22.php

2021 年度 実績報告書

余剰コアを活用する高性能計算・データ解析支援

研究代表者

塙 敏博 東京大学, 情報基盤センター, 教授 (30308283)

現在までの達成度 (区分)

理由

研究成果

[雑誌論文] 余剰コアを活用したOpenMP TaskによるIn-situ解析の実現2022

著者名/発表者名

雑誌名

[学会発表] Numerical Evaluation of Dynamic Core Binding Library with H-matrix Application2022

著者名/発表者名

学会等名

[学会発表] メニーコアシステムにおける余剰コア有効利用に向けて2022

著者名/発表者名

学会等名

[学会発表] Multi-GPU computing of moving boundary flow using lattice Boltzmann method2022

著者名/発表者名

学会等名

[備考] UT-Helper: Support for Utilizing Unused cores

URL

2021 年度実績報告書

塙敏博東京大学, 情報基盤センター, 教授 (30308283)