• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2019 Fiscal Year Annual Research Report

H行列法ライブラリの機能拡張と次世代スパコン向け最適化

Research Project

Project/Area Number 17H01749
Research InstitutionThe University of Tokyo

Principal Investigator

伊田 明弘  東京大学, 情報基盤センター, 特任准教授 (80742121)

Co-Investigator(Kenkyū-buntansha) 横田 理央  東京工業大学, 学術国際情報センター, 准教授 (20760573)
岩下 武史  北海道大学, 情報基盤センター, 教授 (30324685)
大島 聡史  九州大学, 情報基盤研究開発センター, 助教 (40570081)
平石 拓  京都大学, 学術情報メディアセンター, 助教 (60528222)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords近似計算 / 低ランク / H行列 / ライブラリ / アルゴリズム / 並列計算 / 高性能計算 / ハイパフォーマンスコンピューティング
Outline of Annual Research Achievements

H行列法ライブラリHACApKの高機能化を目的とし、次の5項目について研究を行った。
(1)本研究で開発した格子H行列について、分散メモリ並列計算システム上で行列・ベクトル積計算を行う際のベクトル分散法を開発した。開発手法を実アプリ(マイクロマグネティクス計算コード)で実装し、性能評価を行った。3,600プロセスを用いた並列計算において、既存のHACApKを用いた計算に比べ10倍以上の高速化効果が得られた。(2)多重極展開・局所展開の変換行列を保存しインタラクションの対称性を利用してGEMMに落とし込む手法を実装した。また、そのGPU実装も完了することができた。これにより、現在世界最速のFMM実装を実現することができた。HACApKとの統合は完了していないが、これで統合の準備は整ったといえる。(3) GPUを用いた高速なH行列計算法の実装に取り込んだ。特に、H行列を用いた連立一次方程式の解法において重要である、H行列ベクトル積に必要な多数の小密行列ベクトル積をGPU上で高速に行う実装法を開発した。得られた成果を査読付き国際会議等にて発表した。(4) H行列ベクトル積の高速化について、混合精度演算を用いる方法について研究を行った。H行列の部分行列の一部を単精度化する方法に加えて、低ランク部分行列のための新たなデータ構造を提示し、さらに本データ構造に基づいて、部分行列のデータを適切に混合精度化する方法を提案した。提案した手法を境界要素解析上で評価し、その有効性を確認した。(5) H行列の分割構造生成処理の動的負荷分散による並列実装の成果を学会・論文誌上で公開し、複数の学会で発表賞を受賞するなど高い評価を得た。さらなる性能改善にも取り組み、特に、複数のCPUコアによるキャッシュの取り合いにより性能が低下していた問題を改善することで、従来実装より約1.6倍の性能向上を実現した。

Research Progress Status

令和元年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和元年度が最終年度であるため、記入しない。

  • Research Products

    (21 results)

All 2020 2019 Other

All Journal Article (9 results) (of which Int'l Joint Research: 3 results,  Peer Reviewed: 9 results,  Open Access: 2 results) Presentation (11 results) (of which Int'l Joint Research: 6 results) Remarks (1 results)

  • [Journal Article] Lattice H-matrices for Massively Parallel Micromagnetic Simulations of Current-induced Domain Wall Motion2020

    • Author(s)
      Akihiro Ida, Tadashi Ataka, Atsushi Furuya
    • Journal Title

      IEEE Transactions on Magnetics

      Volume: 56(4) Pages: 1-4

    • DOI

      10.1109/TMAG.2019.2959349

    • Peer Reviewed
  • [Journal Article] Effect of Mixed Precision Computing on H-Matrix Vector Multiplication in BEM Analysis2020

    • Author(s)
      Rise Ooi, Takeshi Fukaya, Takeshi Iwashita, Akihiro Ida, Rio Yokota
    • Journal Title

      International Conference on High Performance Computing in Asia-Pacific Redion

      Volume: なし Pages: 92-101

    • DOI

      10.1145/3368474.3368479

    • Peer Reviewed
  • [Journal Article] Evaluation of Programming Models to Address Load Imbalance on Distributed Multi-Core CPUs: A Case Study with Block Low-Rank Factorization2019

    • Author(s)
      Yu Pei, George Bosilca, Ichitaro Yamazaki, Akihiro Ida, Jack Dongarra
    • Journal Title

      IEEE/ACM Parallel Applications Workshop, Alternatives To MPI (PAW-ATM)

      Volume: なし Pages: 25-36

    • DOI

      10.1109/PAW-ATM49560.2019.00008

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Parallelization of Matrix Partitioning in Construction of Hierarchical Matrices using Task Parallel Languages2019

    • Author(s)
      Zhengyang Bai, Tasuku Hiraishi, Hiroshi Nakashima, Akihiro Ida, Masahiro Yasugi
    • Journal Title

      Journal of Information Processing

      Volume: 27 Pages: 840-851

    • DOI

      10.2197/ipsjjip.27.840

    • Peer Reviewed / Open Access
  • [Journal Article] QR Factorization of Block Low-Rank Matrices with Weak Admissibility Condition2019

    • Author(s)
      Akihiro Ida, Hiroshi Nakashima, Tasuku Hiraishi, Ichitaro Yamazaki, Rio Yokota, Takeshi Iwashita
    • Journal Title

      Journal of Information Processing

      Volume: 27 Pages: 831-839

    • DOI

      10.2197/ipsjjip.27.831

    • Peer Reviewed / Open Access
  • [Journal Article] Optimization of Numerous Small Dense-Matrix-Vector Multiplications in H-matrix Arithmetic on GPU2019

    • Author(s)
      Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota
    • Journal Title

      Auto-Tuning for Multicore and GPU (ATMG) In conjunction with the IEEE MCSoC-19

      Volume: なし Pages: 9-16

    • DOI

      10.1109/MCSoC.2019.00009

    • Peer Reviewed
  • [Journal Article] Distributed Memory Lattice H-matrix Factorization2019

    • Author(s)
      Ichitaro Yamazaki, Akihiro Ida, Rio Yokota, Jack Dongarra
    • Journal Title

      The International Journal of High Performance Computing Applications

      Volume: 33(5) Pages: 1046-1063

    • DOI

      10.1177/1094342019861139

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Large-scale electromagnetic field analyses of coils wound with coated conductors using a current-vector-potential formulation with a thin-strip approximation2019

    • Author(s)
      Takeshi Mifune, Naoki Tominaga, Yusuke Sogabe, Yudai Mizobata, Masahiro Yasunaga, Akihiro Ida, Takeshi Iwashita, Naoyuki Amemiya
    • Journal Title

      Superconductor Science and Technology

      Volume: 32(9) Pages: 094002

    • DOI

      10.1088/1361-6668/ab1d35

    • Peer Reviewed
  • [Journal Article] Extreme Scale FMM-Accelerated Boundary Integral Equation Solver for Wave Scattering2019

    • Author(s)
      Mustafa AbdulJabbar, Mohammed Al Farhan, Noha Al-Harthi, Rui Chen, Rio Yokota, Hakan Bagci, David Keyes
    • Journal Title

      SIAM Journal on Scientific Computing

      Volume: 4(3) Pages: C245-C268

    • DOI

      10.1137/18M1173599

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] Numerical Linear Algebra Based on Lattice H-Matrices2020

    • Author(s)
      Akihiro Ida, Ichitaro Yamazaki, Rio Yokota, Satoshi Ohshima, Tasuku Hiraishi, Takeshi Iwashita, Tetsuya Hoshino, Toshihiro Hanawa
    • Organizer
      International Conference on High Performance Computing in Asia-Pacific Redion (HPC Asia 2020)
    • Int'l Joint Research
  • [Presentation] Application of the Fast Micromagnetic Simulation to Thin Spintronic devices2019

    • Author(s)
      Tadashi Ataka, Akihiro Ida, Atsushi Furuya, Koichi Shimizu, Jun Fujisaki, Tomohiro Tanaka, Hirotaka Oshima
    • Organizer
      22nd International Conference on the Computation of Electromagnetic Fields (Compumag 2019)
    • Int'l Joint Research
  • [Presentation] Lattice H-matrices for Massively Parallel Micromagnetic Simulations of Current-induced Domain Wall Motion2019

    • Author(s)
      Akihiro Ida, Tadashi Ataka, Atsushi Furuya
    • Organizer
      22nd International Conference on the Computation of Electromagnetic Fields (Compumag 2019)
    • Int'l Joint Research
  • [Presentation] 修正グラムシュミット法によるBLR 行列の近似QR 分解2019

    • Author(s)
      伊田明弘
    • Organizer
      日本応用数理学会2019年度年会
  • [Presentation] ブロック低ランク行列による近似QR分解2019

    • Author(s)
      伊田 明弘
    • Organizer
      第24回計算工学会
  • [Presentation] Improvement of HACApK Library Using Lattice H-matrices2019

    • Author(s)
      Akihiro Ida
    • Organizer
      France-Japan-Germany trilateral workshop : Convergence of HPC and Data Science for Future Extreme Scale Intelligent Applications
    • Int'l Joint Research
  • [Presentation] GPUによる階層型行列計算法の高速化に向けた多数の小密行列ベクトル積計算の最適化2019

    • Author(s)
      大島 聡史, Ichitaro Yamazaki, 伊田 明弘, 横田 理央
    • Organizer
      日本応用数理学会2019年度年会
  • [Presentation] メニーコアクラスタにおける階層型行列法の高速化に向けた性能評価2019

    • Author(s)
      星野 哲也,伊田 明弘
    • Organizer
      第24回計算工学会
  • [Presentation] An Optimization of H-matrix-vector Multiplication by Using Un-used Cores2019

    • Author(s)
      Tetsuya Hoshino, Toshihiro Hanawa, Akihiro Ida
    • Organizer
      International Conference on High Performance Computing in Asia-Pacific Redion (HPC Asia 2020)
    • Int'l Joint Research
  • [Presentation] Implementation of Partitioning of Hierarchical Matrices using Task Parallel Languages2019

    • Author(s)
      Zhengyang Bai, Tasuku Hiraishi, Hiroshi Nakashima, Akihiro Ida, Masahiro Yasugi
    • Organizer
      48th International Conference on Parallel Processing (ICPP 2019)
    • Int'l Joint Research
  • [Presentation] Parallelization of Matrix Partitioning in Construction of Hierarchical Matrices using Task Parallel Languages2019

    • Author(s)
      白 正陽,平石 拓,中島 浩,伊田 明弘,八杉 昌宏
    • Organizer
      The 3rd cross-disciplinary Workshop on Computing Systems, Infrastructures, and Programming (xSIG 2019)
  • [Remarks] HACApK code

    • URL

      https://github.com/Post-Peta-Crest/ppOpenHPC/tree/MATH/HACApK

URL: 

Published: 2021-01-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi