• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Construction of numerical linear algebra based on lattice H-matrices and its high-performance implementation on modern architectures

Research Project

Project/Area Number 21H03447
Research InstitutionJapan Agency for Marine-Earth Science and Technology

Principal Investigator

伊田 明弘  国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 主任研究員 (80742121)

Co-Investigator(Kenkyū-buntansha) 横田 理央  東京工業大学, 学術国際情報センター, 教授 (20760573)
塙 敏博  東京大学, 情報基盤センター, 教授 (30308283)
岩下 武史  北海道大学, 情報基盤センター, 教授 (30324685)
大島 聡史  九州大学, 情報基盤研究開発センター, 准教授 (40570081)
星野 哲也  名古屋大学, 情報基盤センター, 准教授 (40775946)
平石 拓  京都橘大学, 工学部, 専任講師 (60528222)
Project Period (FY) 2021-04-01 – 2024-03-31
Keywords近似計算 / 低ランク / H行列法 / 数値線形代数 / 行列近似 / 高性能計算 / 並列計算 / アルゴリズム
Outline of Annual Research Achievements

格子H行列に関連する低ランク構造行列法のアルゴリズムの研究・開発を行った。格子H行列の特殊な場合である対称ブロック低ランク(BLR)行列について、近似的な全固有値・固有ベクトルを求めるための数学理論を提案し、具体的な計算手法を開発した。この手法で計算した近似固有値・固有ベクトルの計算精度を保証するための数学的理論を提案し、数値実験を用いて検証した。
格子H行列法の適用範囲の拡大に取り組んだ。格子H行列法コードHACApKを適用した地震周期解析コードHBIに対して、MPI+OpenMPハイブリッド並列計算の最適化を行った。最適化コードを用いて、日本列島中央構造線の大規模地震周期シミュレーションを実施した。また、三次元波動解析へ格子H行列法を適用する理論および数値計算法のプロトタイプを考案した。
格子H行列法の高性能実装に関する研究を実施した。タスク並列化言語Tascellに効率的なワークスチール機能を追加し、分散メモリ並列計算機上でのH行列分割生成および低ランク構造行列生成の計算性能を向上させることに成功した。また、最新CPUアーキテクチャを用いた計算ノード(AMD EPYC、Fujitusu A64FX、Intel Xeon Cascade Lake)で、H行列・ベクトル積計算を効率的に行うための手法を開発した。開発手法の計算性能(FLOPS換算)は、全種類のCPUノードでの理論的限界値の85%以上の性能を達成した。さらに、最新GPUのMIG機能を用いて、BLR行列に対するQR分解高速に行う手法を開発した。性能評価結果、MIGを用いることでMIGを用いない場合よりも実行時間を78%短縮できた。使用メモリは密行列(5万元)の場合の約10%に低減された。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

本研究は格子H行列に対し、(1)数値計算アルゴリズムの研究開発、(2)適用範囲拡大の研究、(3)高性能実装法に関する研究、の3つの研究項目に大別される。研究項目(1)については、固有値計算法および計算精度保証に関する新しいアルゴリズムを提案し、1本の査読付き学術誌論文および2件の学会発表を行った。研究項目(2)については、地震周期解析へ格子H行列法を適用する研究成果を元に、1件の国際会議発表と1本の学術誌論文を発表した。また、三次元波動解析へ格子H行列法適用法の関する研究では、2件の学会発表を行った。研究項目(3)については、タスク並列言語を用いた格子H行列法生成の動的負荷分散に関する研究で、2本の査読付き学術誌論文を発表した。また、最新CPU上での格子H行列ベクトル積計算法に関する研究、および、GPU上のMIG機能を用いたBLR行列QR分解に関する研究で、それぞれ1本ずつの査読付き学術誌論文を発表した。
全ての研究項目について、多くの研究成果が得られており、おおむね順調に進展している。

Strategy for Future Research Activity

格子H行列に関連する低ランク近似手法の数値計算アルゴリズムについて、これまでに行った固有値計算法、LU分解法、QR分解法の研究開発を引き続き実施する。BLR行列の全固有値計算法の並列化アルゴリズムを開発する。ブロック三重対角化を用いた全固有値計算手法に加えて、指定した範囲内にある中間固有値を低ランク近似行列のLU分解に基づき計算する手法の開発を行う。また、格子H行列の分割構造を、補助情報(座標情報など)を用いず、行列要素情報のみから構築する数学的手法を研究する。
格子H行列の適用対象拡大の研究に関しては、動的破壊シミュレーションに用いられる数値計算手法であるFDPM法と格子H行列法を組み合わせた新手法を地震波伝搬問題に適用する。また、MRI検査装置などに用いられるコイルの配位最適化計算に現れる長方行列に対して、低ランク近似手法を適用する研究を実施する。
高性能実装法に関する研究に関しては、格子H行列ベクトル積計算を分散メモリ並列計算システム上でMPI/OpenMPハイブリッド並列で実行する際に、MPIプロセスごとに異なる数のOpenMPスレッドを割り当てる機構を開発する。この機構において、量子アニーラを用いて最適配分を予測する手法についても取り組む。また、格子H行列ベクトル積計算のGPU化、最新CPU上最適化、FPGA向け実装法の研究を実施する。

  • Research Products

    (14 results)

All 2024 2023 2022 Other

All Journal Article (8 results) (of which Int'l Joint Research: 1 results,  Peer Reviewed: 6 results,  Open Access: 2 results) Presentation (5 results) (of which Int'l Joint Research: 3 results,  Invited: 1 results) Remarks (1 results)

  • [Journal Article] An inherently parallel H2-ULV factorization for solving dense linear systems on GPUs2024

    • Author(s)
      Ma Qianxiang、Yokota Rio
    • Journal Title

      The International Journal of High Performance Computing Applications

      Volume: 1 Pages: -

    • DOI

      10.1177/10943420241242021

    • Peer Reviewed
  • [Journal Article] Solving Block Low-Rank Matrix Eigenvalue Problems2022

    • Author(s)
      Ida Akihiro
    • Journal Title

      Journal of Information Processing

      Volume: 30 Pages: 538~551

    • DOI

      10.2197/ipsjjip.30.538

    • Peer Reviewed / Open Access
  • [Journal Article] Optimizations of H-matrix-vector Multiplication for Modern Multi-core Processors2022

    • Author(s)
      Hoshino Tetsuya、Ida Akihiro、Hanawa Toshihiro
    • Journal Title

      In Proceedings of 2022 IEEE International Conference on Cluster Computing (CLUSTER)

      Volume: 1 Pages: 462~472

    • DOI

      10.1109/CLUSTER51413.2022.00056

    • Peer Reviewed
  • [Journal Article] Parallelization of Matrix Partitioning in Hierarchical Matrix Construction on Distributed Memory Systems2022

    • Author(s)
      Bai Zhengyang、Hiraishi Tasuku、Ida Akihiro、Yasugi Masahiro
    • Journal Title

      Journal of Information Processing

      Volume: 30 Pages: 742~754

    • DOI

      10.2197/ipsjjip.30.742

    • Peer Reviewed / Open Access
  • [Journal Article] Large-scale earthquake sequence simulations on 3-D non-planar faults using the boundary element method accelerated by lattice H-matrices2022

    • Author(s)
      Ozawa So、Ida Akihiro、Hoshino Tetsuya、Ando Ryosuke
    • Journal Title

      Geophysical Journal International

      Volume: 232 Pages: 1471~1481

    • DOI

      10.1093/gji/ggac386

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Construction of Hierarchical Matrix on Distributed Memory Systems using a Task Parallel Language2022

    • Author(s)
      Bai Zhengyang、Hiraishi Tasuku、Ida Akihiro、Yasugi Masahiro、Fukazawa Keiichiro
    • Journal Title

      In Proceedings of 2022 The Tenth International Symposium on Computing and Networking Workshops (CANDARW)

      Volume: 1 Pages: 48~54

    • DOI

      10.1109/candarw57323.2022.00058

    • Peer Reviewed
  • [Journal Article] 対称ブロック低ランク行列の固有値問題解法2022

    • Author(s)
      伊田明弘
    • Journal Title

      SWoPP2022(HPC研究分科会)

      Volume: 2022-HPC-185 Pages: 1~8

  • [Journal Article] 対称ブロック低ランク行列の精度保証付き固有値問題解法2022

    • Author(s)
      伊田 明弘、荻田 武史、 横田 理央
    • Journal Title

      日本応用数理学会(2022年度年会)

      Volume: 1 Pages: 1~2

  • [Presentation] QR Factorization of Block Low-rank Matrices on Multiple-/Multi-Instance GPUs2023

    • Author(s)
      Satoshi Ohshima
    • Organizer
      2024 Conference on Advanced Topics and Auto Tuning in High-Performance Scientific Computing
    • Int'l Joint Research / Invited
  • [Presentation] BLR-QR on GPU:マルチインスタンスGPUを用いた多数の小密行列計算の高速化2022

    • Author(s)
      大島聡史,伊田明弘,横田理央,Yamazaki Ichitaro
    • Organizer
      第14回 自動チューニング技術の現状と応用に関するシンポジウム(ATTA2022)
  • [Presentation] High-resolution Simulation of Earthquake Recurrence Enabled by Optimization for Multi-core CPUs and Large-scale Parallelization2022

    • Author(s)
      Ryosuke Ando, So Ozawa, Akihiro Ida, Tetsuya Hoshino, Kazunori Muramatsu, Ryoya Matsushima, Masatoshi Kawai, Toshihiro Hanawa
    • Organizer
      The International Conference for High Performance Computing, Networking, Storage, and Analysis 2023 (SC23)
    • Int'l Joint Research
  • [Presentation] CholeskyQRとBCGS2による非縦長行列のQR分解2022

    • Author(s)
      門倉陣之介, 深谷猛, 岩下武史
    • Organizer
      The 6th cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2022)
  • [Presentation] A new version of AINV preconditioning simplified by using nonzero element positions of a coefficient matrix2022

    • Author(s)
      Kengo Suzuki, Takeshi Fukaya and Takeshi Iwashita
    • Organizer
      15th World Congress on Computational Mechanics 8th Asian Pacific Congress on Compuational Mechanics (WCCM-APCOM YOKOHAMA2022)
    • Int'l Joint Research
  • [Remarks] HACApK code

    • URL

      https://github.com/Post-Peta-Crest/ppOpenHPC/tree/MATH/HACApK

URL: 

Published: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi