• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

余剰コアを活用する高性能計算・データ解析支援

Research Project

Project/Area Number 20H00580
Research InstitutionThe University of Tokyo

Principal Investigator

塙 敏博  東京大学, 情報基盤センター, 教授 (30308283)

Co-Investigator(Kenkyū-buntansha) 下川辺 隆史  東京大学, 情報基盤センター, 准教授 (40636049)
星野 哲也  名古屋大学, 情報基盤センター, 准教授 (40775946)
三木 洋平  東京大学, 情報基盤センター, 助教 (70734375)
伊田 明弘  国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報基盤センター), 副主任研究員 (80742121)
Project Period (FY) 2020-04-01 – 2023-03-31
Keywords高性能計算 / メニーコアプロセッサ / 余剰コア / 計算科学 / 並列処理 / 非同期IO
Outline of Annual Research Achievements

①余剰コアを用いたIn-situ解析として、銀河衝突シミュレーションにおける主計算(重力多体シミュレーションを用いた時間進化の計算)と副計算(数値的に得られた構造と実際に観測されている構造とを比較する解析処理)を同時に処理する機能を実現した。OpenMPのtask指示文を用いることで、プログラムの構造を大きく変えずに実現することができた。
本機能の実現により、全体の実行時間は最短で54%になるまで高速化された。
②分散メモリ計算環境向けにMPI+OpenMP並列化されたアプリケーションに対して、動的な負荷不均衡解消手法の開発を行った。2020年度までに、MPIプロセス毎のコア割当数を制御し、ノード内負荷不均衡を緩和する手法を提案し成果を得ていた。2021年度は、ノード間負荷不均衡の問題に取り組んだ。この問題をNP困難な組合せ最適化問題と捉え、量子アニーリングマシンを用いて解くべく、QUBOモデルへの落とし込みを検討した。
③複数GPUによるステンシル計算では、GPU間の通信がアプリケーション性能低下につながる。本年度は、GPU計算中にCPUの余剰コアを用いてGPU間通信を行う通信隠蔽手法を開発した。計算領域を複数GPUへどのように分割して割り当てるかが実行性能に大きく影響することがわかり、領域の分割方法を変えながら、性能向上に対する通信隠蔽手法の有効性について検証を行った。
④冗長な計算を必要とするOverlapped型のテンポラルブロッキングに加え、冗長な計算を必要としないtrapezoid型、及び両者のハイブリッドのテンポラルブロッキングを3次元の拡散方程式に実装し、最新のプロセッサにおいて評価を行った。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

UTHelperの実現に向けて、In-situ解析処理として、比較的容易な方法で元のプログラムの構造を大きく変えずに主計算と副計算を実現できることを示した。UTHelperが対象とする機能として想定している、非同期ファイルIOやIn-Situ処理については、実アプリケーションに対して容易に機能追加を行うことができることが求められ、実現可能性を示せたことは、アプリケーション作成者に対して有益である。
また、OpenMPに加えてMPIプロセスまで含めた負荷不均衡を解消する方法についても検証を進めており、電力あたり性能の改善も得られる見通しである。
複数ノードのGPU間通信を効率的に行うためにCPUコアを用いることで通信隠蔽を実現して性能向上が得られており、
ステンシル計算において多く用いられるテンポラルブロッキングについても、余剰の演算器を活用して本質的には冗長な計算をあえて行わせることで、メモリに対する負荷を下げ、全体の性能を改善することができている。

Strategy for Future Research Activity

動的なプロファイリングスレッド数変更に加え、コアの割り当て変更についても外部から動的に行えるよう、OpenMPのランタイムライブラリと連携した動的チューニング機能を実現する。加えて、MPIプロセスと連携した負荷均衡の仕組みも引き続き検討していく。また、最新のIntel Xeon, AMD EPYCを始めとした様々なメニーコア/マルチコアプロセッサを用いて予備評価を行い、主計算の分析 と余剰コアの扱い方について検証を行っていく。アプリケーション中で補助機能を簡便に利用できるように、ヘルパースレッドを主計算とはある程度分離された形で実行しつつ、主計算とインタラクションするような機構が必要であり、OpenMP実行環境との整合性を保ちつつ実現する必要がある。 併せて、実アプリケーションを用いて、非同期ファイルIOやIn-Situ解析機能に向けた最適な余剰コアの活用方法を検討していく。

  • Research Products

    (5 results)

All 2022 Other

All Journal Article (1 results) Presentation (3 results) (of which Int'l Joint Research: 2 results,  Invited: 2 results) Remarks (1 results)

  • [Journal Article] 余剰コアを活用したOpenMP TaskによるIn-situ解析の実現2022

    • Author(s)
      赤沢 龍哉, 塙 敏博, 三木 洋平
    • Journal Title

      情報処理学会研究報告ハイパフォーマンスコンピューティング

      Volume: 2022-HPC-183 Pages: 1-10

  • [Presentation] Numerical Evaluation of Dynamic Core Binding Library with H-matrix Application2022

    • Author(s)
      Masatoshi Kawai, Akihiro Ida
    • Organizer
      2022 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • Int'l Joint Research / Invited
  • [Presentation] メニーコアシステムにおける余剰コア有効利用に向けて2022

    • Author(s)
      塙 敏博
    • Organizer
      第28回 自動チューニング研究会オープンアカデミックセッション(ATOS28)
    • Invited
  • [Presentation] Multi-GPU computing of moving boundary flow using lattice Boltzmann method2022

    • Author(s)
      Akira Hatakeyama, Takashi Shimokawabe
    • Organizer
      International Conference on High Performance Computing in Asia-Pacific Region (HPCAsia) 2022, poster
    • Int'l Joint Research
  • [Remarks] UT-Helper: Support for Utilizing Unused cores

    • URL

      https://www.cc.u-tokyo.ac.jp/en/public/sc22.php

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi