• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2018 Fiscal Year Annual Research Report

H行列法ライブラリの機能拡張と次世代スパコン向け最適化

Research Project

Project/Area Number 17H01749
Research InstitutionThe University of Tokyo

Principal Investigator

伊田 明弘  東京大学, 情報基盤センター, 特任准教授 (80742121)

Co-Investigator(Kenkyū-buntansha) 横田 理央  東京工業大学, 学術国際情報センター, 准教授 (20760573)
岩下 武史  北海道大学, 情報基盤センター, 教授 (30324685)
大島 聡史  九州大学, 情報基盤研究開発センター, 助教 (40570081)
平石 拓  京都大学, 学術情報メディアセンター, 助教 (60528222)
Project Period (FY) 2017-04-01 – 2020-03-31
Keywords近似計算 / 低ランク / H行列 / ライブラリ / アルゴリズム / 並列計算 / 高性能計算 / ハイパフォーマンスコンピューティング
Outline of Annual Research Achievements

H行列法ライブラリHACApKの高機能化を目的とし、次の5項目について研究を行った。
(1) 本研究で提案した格子H行列の行列分解に取り組み、近似LU分解および近似QR分解を行う計算手法を開発した。格子H行列の特殊な場合であるBLR行列について、これらの分解手法を実装し、数値実験を行った。近似精度および計算コストについて調査し、開発手法の有効性を確かめた。(2)HACApKで扱う任意のカーネルに対応できように、FMMを拡張した。また、境界要素法のコードからこのFMMを呼び出すことにも成功した。(3)GPUを用いたH行列計算法コードの開発を実施した。特にGPUを用いたH行列ベクトル積に注目し、従来より高速な実装の実現に向けたコード開発に取り組んだ。さらに、複数GPU環境における格子H行列に対するLU分解についての研究を実施した。分散環境におけるLU分解は行列ベクトル積と比べて通信パターンが複雑なため実装や最適化の難易度が高く、大変挑戦的な研究である。(4)H行列ベクトル積の高速化について取り組んだ。スレッド並列処理における負荷均衡戦略として,スレッド間にまたがる少数の部分行列を分割することで,ほぼ完全な負荷均衡化を図ることができることを示し、HACApKライブラリに含まれる従来実装の性能改善が可能なことを示した。また、H行列内の部分行列の一部を単精度化する新たな手法を考案し、計算の高速化、精度の悪化の程度について、実験的な調査を行った。(5)H行列の分割構造生成処理について、動的負荷分散を用いた高速化に取り組んだ。特に、並列実装の性能改善に注力した。分割構造を表現する木の生成において、ノード間だけでなくノード内の並列化を組み合わせ、さらにタスクの最小粒度等の性能パラメータのチューニングを施すことにより、良好な並列性能を得ることができた。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

下記の通り、5つの研究項目ごとに達成度は異なるが、総じて概ね順調である。
(1)格子H行列について、近似分解計算手法を構築した。格子H行列の特殊な場合であるBLR行列について逐次コードを実装し、数値実験を通じて有効性を確かめた。格子H行列は分散メモリ計算システム向けに開発した低ランク近似手法であり、大規模計算に向けた基礎を築けた。(2)FMMコードをHACApKで扱うGreen関数に拡張し、それを実際の境界要素法のアプリケーションから呼び出すことにより、実アプリケーションコードを高速化することに成功した。従来のFMMで用いられてきた空間充填曲線を用いた負荷分散では境界要素法のような低次元の超平面において最適な空間分割が得られない問題があったが、これを直交再帰二分割法を用いて解決し、電磁界解析の実アプリケーションで高い分散並列化効率を実現した。(3)GPUを用いたH行列計算法のさらなる性能向上のためには、大量の小さな部分行列を効率よく計算することが重要であることを明らかにした。また、複数GPU環境における格子H行列に対するLU分解の実装を行った。高速な実装を実現するとともに、通信時間の削減や負荷の均等化の難しさも明らかにした。(4)H行列・ベクトル積計算のスレッド並列処理の負荷均衡については、アルゴリズム上はほぼ最適な手法を考案することができた。低精度演算を導入することによる行列・ベクトル積の高速化については、すでに一部のアプリケーション上で有用な結果を得ている。(5)H行列の分割構造生成処理については、分散メモリ環境対応の実装までは至らなかったものの、共有メモリ環境における木の構築処理については、ほぼ期待通りの性能が得られた。

Strategy for Future Research Activity

5つの研究項目ごとの推進方策は次の通りである。
(1)分散メモリ計算システム上で、格子H行列に対して近似分解を行うための研究を推進する。まずは現状のBLR行列分解の共有メモリ並列化アルゴリズムを開発し、その後、分散メモリ並列化アルゴリズムの開発を行う。分散メモリシステムを用い、大規模行列について計算精度および計算コストを調べる。ここまでの検証をBLR行列で行い、問題点を全て解決してから格子H行列に移行する。(2)これまでに開発したFMMコードとは別に、多重極展開・局所展開の変換行列を保存し、インタラクションの対称性を利用してGEMMに落とし込む手法を採用したFMMコードを開発中である。これらのFMMコードの統合とHACApKとの融合が今後の課題である。(3)GPUを用いた高速なH行列計算法・格子H行列計算法の実装を継続して行う。行列・ベクトル積や行列分解の計算性能を観測し、行列生成時のパラメタ最適化を行う手法を検討していく。(4)H行列に低精度演算を取り入れる方式による性能改善は、現在の所、その有効性が明らかとなりつつあるので、引き続き研究を推進する。具体的にはアプリケーションにおける性能評価を行い、その報告を行うと共に、アルゴリズムの改良についても検討する。(5)H行列の分割構造生成処理を分散メモリ環境で行う実装に本格的に取り組む。共有メモリ環境向け実装についても、参照局所性の向上等によるさらなる性能改善の余地があるため、改良を続けていく。さらに、格子H行列を対象とした分割構造生成についても並列化を行う。

  • Research Products

    (23 results)

All 2019 2018 Other

All Journal Article (7 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 7 results) Presentation (15 results) (of which Int'l Joint Research: 7 results,  Invited: 2 results) Remarks (1 results)

  • [Journal Article] Large-scale electromagnetic field analyses of coils wound with coated conductors using a current-vector-potential formulation with a thin-strip approximation2019

    • Author(s)
      Mifune Takeshi、Tominaga Naoki、Sogabe Yusuke、Mizobata Yudai、Yasunaga Masahiro、Ida Akihiro、Iwashita Takeshi、Amemiya Naoyuki
    • Journal Title

      Superconductor Science and Technology

      Volume: 印刷中 Pages: 印刷中

    • Peer Reviewed
  • [Journal Article] Extreme Scale FMM-Accelerated Boundary Integral Equation Solver for Wave Scattering2019

    • Author(s)
      Mustafa Abduljabbar, Mohammed Al Farhan, Noha Al-Harthi, Rui Chen, Rio Yokota, Hakan Bagci, David Keyes
    • Journal Title

      SIAM Journal on Scientific Computing

      Volume: 印刷中 Pages: 印刷中

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Lattice H-Matrices on Distributed-Memory Systems2018

    • Author(s)
      Ida Akihiro
    • Journal Title

      32nd IEEE International Parallel & Distributed Processing Symposium (IPDPS 2018)

      Volume: - Pages: 389~898

    • DOI

      10.1109/IPDPS.2018.00049

    • Peer Reviewed
  • [Journal Article] Performance of Hierarchical-matrix BiCGStab Solver on GPU Clusters2018

    • Author(s)
      Yamazaki Ichitaro、Abdelfattah Ahmad、Ida Akihiro、Ohshima Satoshi、Tomov Stanimire、Yokota Rio、Dongarra Jack
    • Journal Title

      32nd IEEE International Parallel & Distributed Processing Symposium (IPDPS 2018)

      Volume: - Pages: 930~939

    • DOI

      10.1109/IPDPS.2018.00102

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Application of Hierarchical Matrices to Large-Scale Electromagnetic Field Analyses of Coils Wound With Coated Conductors2018

    • Author(s)
      Tominaga Naoki、Mifune Takeshi、Ida Akihiro、Sogabe Yusuke、Iwashita Takeshi、Amemiya Naoyuki
    • Journal Title

      IEEE Transactions on Applied Superconductivity

      Volume: 28 Pages: 1~5

    • DOI

      10.1109/TASC.2017.2780821

    • Peer Reviewed
  • [Journal Article] Design of Parallel BEM Analyses Framework for SIMD Processors2018

    • Author(s)
      Hoshino Tetsuya、Ida Akihiro、Hanawa Toshihiro、Nakajima Kengo
    • Journal Title

      Lecture Notes in Computer Science

      Volume: 10860 Pages: 601~613

    • DOI

      10.1007/978-3-319-93698-7_46

    • Peer Reviewed
  • [Journal Article] Load-Balancing-Aware Parallel Algorithms of H-Matrices with Adaptive Cross Approximation for GPUs2018

    • Author(s)
      Hoshino Tetsuya、Ida Akihiro、Hanawa Toshihiro、Nakajima Kengo
    • Journal Title

      IEEE International Conference on Cluster Computing (CLUSTER 2018)

      Volume: - Pages: -

    • DOI

      10.1109/CLUSTER.2018.00016

    • Peer Reviewed
  • [Presentation] Lattice H-matrices for Massively Parallel Micromagnetic Simulations of Current-induced Domain Wall Motion2019

    • Author(s)
      Akihiro Ida, Tadashi Ataka and Atsushi Furuya
    • Organizer
      22nd International Conference on the Computation of Electromagnetic Fields (Compumag 2019)
    • Int'l Joint Research
  • [Presentation] Application of the Fast Micromagnetic Simulation to Thin Spintronic devices2019

    • Author(s)
      Tadashi Ataka, Akihiro Ida, Atsushi Furuya, Koichi Shimizu, Jun Fujisaki, Tomohiro Tanaka and Hirotaka Oshima
    • Organizer
      22nd International Conference on the Computation of Electromagnetic Fields (Compumag 2019)
    • Int'l Joint Research
  • [Presentation] Matrix Arithmetic Using Lattice H-matrix Representations2019

    • Author(s)
      Akihiro Ida
    • Organizer
      ATAT in HPC 2019
    • Int'l Joint Research / Invited
  • [Presentation] 大規模数値解析向け低ランク行列近似手法2019

    • Author(s)
      伊田明弘
    • Organizer
      第52回FrontISTR研究会
    • Invited
  • [Presentation] Distributed Memory Lattice H-Matrix Factorization2019

    • Author(s)
      Ichitaro Yamazaki, Akihiro Ida, Rio Yokota, and Jack Dongarra
    • Organizer
      SIAM Conference on Computational Science and Engineering 2019(SIAM CSE 19)
    • Int'l Joint Research
  • [Presentation] H-Matrix Framework for Many-core Processors2019

    • Author(s)
      Tetsuya Hoshino and Akihiro Ida
    • Organizer
      SIAM Conference on Computational Science and Engineering 2019(SIAM CSE 19)
    • Int'l Joint Research
  • [Presentation] Parallelization of Matrix Partitioning in Construction of Hierarchical Matrices using Task Parallel Languages2019

    • Author(s)
      白 正陽, 平石 拓, 中島 浩, 伊田 明弘, 八杉 昌宏
    • Organizer
      情報処理学会第122回プログラミング研究会
  • [Presentation] Accelerating Multithreaded Linear Solver with Mixed Precision Hierarchical Matrix Computation and Data Structure2019

    • Author(s)
      Rise Ooi Kok Thong, Takeshi Fukaya and Takeshi Iwashita
    • Organizer
      日本応用数理学会 応用数理 学生・若手研究者 のための研究交流会
  • [Presentation] Progress of Large-Scale and Fast Electromagnetic Field Analyses of Coils Wound with Coated Conductors for Ac Loss and Shielding Current Calculations2018

    • Author(s)
      Naoyuki Amemiya, Naoki Tominaga, Takeshi Mifune, Yusuke Sogabe, Yudai Yasunaga, Akihiro Ida and Takeshi Iwashita
    • Organizer
      6th International Workshop on Numerical Modelling of High Temperature Superconductors (HTS Modelling 2018)
    • Int'l Joint Research
  • [Presentation] 格子H行列を用いた並列行列計算2018

    • Author(s)
      伊田明弘
    • Organizer
      2018年並列/分散/協調処理に関する『熊本』サマー・ワークショップ(SWoPP熊本2018)
  • [Presentation] 格子階層型行列法:分散メモリ並列計算機向け階層型低ランク近似手法2018

    • Author(s)
      伊田明弘
    • Organizer
      第23回計算工学会
  • [Presentation] More Efficient Structures of H-matrices2018

    • Author(s)
      Akihiro Ida, Ichitaro Yamazaki, Rio Yokota, Satoshi Ohshima, Tetsuya Hoshino, Tasuku Hiraishi and Takeshi Iwashita
    • Organizer
      The HPC symposium Computational Science at Scale (CoSaS18)
    • Int'l Joint Research
  • [Presentation] H行列ベクトル積のスレッド並列化における負荷均衡に関する検討2018

    • Author(s)
      岩下 武史,川村 卓人,深谷 猛,伊田 明弘
    • Organizer
      2018年並列/分散/協調処理に関する『熊本』サマー・ワークショップ(SWoPP熊本2018)
  • [Presentation] 階層型行列計算におけるソフトウェア自動チューニング2018

    • Author(s)
      大島 聡史、山崎 市太郎、伊田 明弘、横田 理央
    • Organizer
      第23回計算工学会
  • [Presentation] Optimization of hierarchical matrix computation on GPU - accelerating many small matrix calculation2018

    • Author(s)
      Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota
    • Organizer
      Sapporo Summer HPC Seminar 2018
  • [Remarks] Post-Peta-Crest/ppOpenHPC/MATH/HACApK

    • URL

      https://github.com/Post-Peta-Crest/ppOpenHPC/tree/MATH/HACApK

URL: 

Published: 2019-12-27  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi