• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

Application of Unconventional Linear Algebra Techniques to Continuous Learning in Supergiant Neural Networks

Research Project

Project/Area Number 20K20624
Research InstitutionTokyo Institute of Technology

Principal Investigator

横田 理央  東京工業大学, 学術国際情報センター, 教授 (20760573)

Co-Investigator(Kenkyū-buntansha) Khan Emtiyaz  国立研究開発法人理化学研究所, 革新知能統合研究センター, チームリーダー (30858022)
大島 聡史  名古屋大学, 情報基盤センター, 准教授 (40570081)
伊田 明弘  国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報基盤センター), 副主任研究員 (80742121)
Project Period (FY) 2020-07-30 – 2024-03-31
Keywords密行列の高速解法 / 階層的低ランク近似 / H行列 / LU分解
Outline of Annual Research Achievements

深層学習へ2次最適化を適用する際に課題となる大規模な密行列の分解を高速かつ並列に行うための新たな手法を複数開発した。大きさがNxNの密行列のLU分解はO(N^3)の計算量を要するが、HSS行列やH行列などの階層的低ランク近似法を用いることでその計算量をO(NlogN)もしくはO(N)に低減できる。しかし、HSS行列では弱許容条件を用いるため高次元の問題では非対角ブロックのランクがNとともに増大しO(N)の手法ではなくなるものおn、ULV分解の原理を応用することでブロック同士の依存性をなくし超並列で計算できる。また、H行列は強許容条件を用いるためランクの増大はないものの、非対角の密ブロックから生じるfill inによりULV分解の原理を用いたとしても超並列な行列分解ができない。本研究ではHSS-ULV分解の並列度とH行列のO(N)の計算量の両方を併せ持つH^2-ULV分解開発した。H^2行列はHSS行列と同様、行や列ブロックの基底を共有する。ただし、基底を共有しただけでは密ブロックから生じるfill inを防げないため、超並列なLU分解はそのままではできない。そこで、予めfill inを計算しておき、それらを行や列ブロックの基底に含めることで、ULV分解の際に生じるfill inを共有基底を更新することなく再圧縮でき、強許容条件を有しながらも超並列なLU分解を世界で初めて実現した。この成果は高性能計算分野のトップカンファレンスであるSC22に採択された。さらに、この研究から派生した研究として超並列性を利用したGPU実装への拡張(IJHPCAに投稿中)、テネシー大学のDongarra研究室との共同研究でPaRSECランタイムを用いた階層間の依存性の緩和(ICPPに投稿中)やLDL分解への拡張による電子状態計算における固有値解法への応用(ICPPに投稿中)などが挙げられる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

博士課程の学生4名が共同で一つのライブラリを開発するという画期的な体制で研究を遂行することができたため、多くの研究成果が得られた。CPUやGPU上での内部カーネルのチューニング、PaRSECなどのランタイムレベルでのタスク並列化、H^2-ULVなどのアルゴリズムレベルでの超並列化、LDL分解への拡張による電子状態計算への応用など、低レイヤーからアプリケーションまでソフトウェアスタックの各レイヤーでの開発を垂直統合型で行うことができたのは、優秀な博士学生4名による共同開発の賜物であるといえる。現在、高性能計算分野のトップジャーナル(IJHPCA, ACM TOMS)に2本、トップカンファレンス(ICPP, EuroPar, Cluster)に5本の論文を投稿中であり、2022年度の研究成果は多くの論文に繋がったといえる。

Strategy for Future Research Activity

本研究に従事している博士学生4名のうち3名は2023年9月に学位を取得する見込みであり、分担機関による分担金の繰越しはあったものの、当初計画では2022年度までの研究期間であったため、2022年度をもって本研究は一区切りついたことになる。ただし、博士学生は修了直前に最も研究のアウトプットは大きくなるため、2023年度はPaRSECなどのランタイムレベルでのタスク並列化、H^2-ULVなどのアルゴリズムレベルでの超並列化、LDL分解への拡張による電子状態計算への応用のテーマがさらに発展することが期待される。

Causes of Carryover

コロナ禍の影響で前年度に研究員の来日が不可能になり、研究計画が大幅に遅れたため。
次年度には、研究体制が整う予定であり計算機利用料と旅費に予算を利用する予定である。

  • Research Products

    (8 results)

All 2023 2022 Other

All Int'l Joint Research (1 results) Journal Article (2 results) (of which Peer Reviewed: 2 results) Presentation (5 results) (of which Int'l Joint Research: 5 results)

  • [Int'l Joint Research] University of Tennessee at Knoxville(米国)

    • Country Name
      U.S.A.
    • Counterpart Institution
      University of Tennessee at Knoxville
  • [Journal Article] Cache Optimization and Performance Modeling of Batched, Small, and Rectangular Matrix Multiplication on Intel, AMD, and Fujitsu Processors2023

    • Author(s)
      Sameer Deshmukh, Rio Yokota, George Bosilca
    • Journal Title

      ACM Transactions on Mathematical Software

      Volume: 未定 Pages: 未定

    • Peer Reviewed
  • [Journal Article] Parallel QR Factorization of Block Low-Rank Matrices2022

    • Author(s)
      Muhammad Ridwan Apriansyah, Rio Yokota
    • Journal Title

      ACM Transactions on Mathematical Software

      Volume: 48(3) Pages: 1-28

    • DOI

      10.1145/3538647

    • Peer Reviewed
  • [Presentation] Mixed-Precision Random Projection for RandNLA on Tensor Cores2023

    • Author(s)
      Hiroyuki Ootomo, Rio Yokota
    • Organizer
      Platform for Advanced Scientific Computing (PASC)
    • Int'l Joint Research
  • [Presentation] O(N) Factorization of Dense Matrices on GPUs Without Trailing Submatrix Dependencies2023

    • Author(s)
      Qianxiang Ma, Rio Yokota
    • Organizer
      SIAM Conference on Computational Science and Engineering (CSE)
    • Int'l Joint Research
  • [Presentation] Parallel QR Factorization of Block Low-Rank Matrices2023

    • Author(s)
      Muhammad Ridwan Apriansyah, Rio Yokota
    • Organizer
      SIAM Conference on Computational Science and Engineering (CSE)
    • Int'l Joint Research
  • [Presentation] QR Factorization of Block Low-Rank Matrices on Multi-Instance GPU2022

    • Author(s)
      Satoshi Ohshima, Akihiro Ida, Rio Yokota and Ichitaro Yamazaki
    • Organizer
      The 23rd International Conference on Parallel and Distributed Computing, Applications and Technologies (PDCAT’22)
    • Int'l Joint Research
  • [Presentation] Scalable Linear Time Dense Direct Solver for 3-D Problems Without Trailing Sub-Matrix Dependencies2022

    • Author(s)
      Qianxiang Ma, Sameer Deshmukh, Rio Yokota
    • Organizer
      The International Conference for High Performance Computing, Networking, Storage, and Analysis (SC22)
    • Int'l Joint Research

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi