• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実績報告書

機械学習向けハードウェアとの親和性が高い連立一次方程式の解法

研究課題

研究課題/領域番号 18H03248
研究機関東京工業大学

研究代表者

横田 理央  東京工業大学, 学術国際情報センター, 准教授 (20760573)

研究分担者 大島 聡史  九州大学, 情報基盤研究開発センター, 助教 (40570081)
伊田 明弘  東京大学, 情報基盤センター, 特任准教授 (80742121)
研究期間 (年度) 2018-04-01 – 2021-03-31
キーワードH行列 / 階層的低ランク近似法 / Tensor Core / 機械学習向けハードウェア
研究実績の概要

今年度の目標は低精度演算の有効活用であったが,これは概ね達成できたといえる.Tensor Coreを用いたQR分解の実装において16bitに起因する精度の低下を補正する手法を考案した.これは16bitの変数を2つ用いて仮数部を2倍に拡張することで情報落ちや丸め誤差を抑制するKahanの加算法に類似した手法である.ただし,Kahanの加算法がスカラーに対する手法なのに対して,本手法はそれを行列に拡張した手法となっている.この精度補正によりTensorCoreを用いたQR分解において単精度と同等の相対残差と直交性を実現することができた.また,このときの演算速度はTensorCoreの性能を最大限に引き出すことができていることを確認した.この成果は高性能計算分野のトップカンファレンスであるSC19のベストポスターの候補に選ばれた.
このような低精度のQR分解を最大限に活用できる手法として階層的低ランク近似法が挙げられる.行列が低精度の浮動小数点で表される場合,それを低ランク近似することで精度をそれ以上劣化させることなく,演算量を大幅に低減できる.今年度は,階層的低ランク近似法として提案されているBLR,HODLR, HSS, H-matrix, H2-matrixの全ての手法を一般化した手法を提案し,C++の機能を最大限に活用することで簡素な実装を行うことができた.このフレームワークを用いて,これら5つの形式に対して行列の加算,行列ー行列積,LU分解,QR分解を容易に実装することができた.この成果は国内外の学会に採択され,現在ジャーナル論文も投稿中である.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

2019年度の目標を達成しただけでなく,階層的低ランク近似法の全てのアルゴリズムに変幻自在に対応できるフレームワークをさらにGPU,MPIへの拡張し,その応用先としても2018年度のLU分解からさらに QR分解にも発展させることができた.

2018年のTensor CoreのQR分解では単に10TFlopsという演算性能のみが得られていたが,2019年度にKahanの加算法を行列に拡張した手法を考案することにより,Tensor Coreの弱点ともいえる精度の面での大幅な改善を行うことに成功した.

今後の研究の推進方策

今年度はPEZY SC2での性能評価までは手が回らなかったが,2020年度の目標は「省電力・耐故障性、ハードウェア間の比較」であるため,このような電力性能をウリにしている異種アーキテクチャ上で実験することを目指す.また,階層的低ランク近似法のQR分解ではまだBLRでしか実験ができていないが,2020年度はHODLR, HSS, H-matrix, H2-matrix全てで実験ができるようにフレームワークを整備する.2019年度後半からテネシー大学のJack Dongarraのグループと共同研究を始めており,ParSECやStarPUを用いた非同期実行によるLU分解,QR分解の分散並列実装を進める予定である.

  • 研究成果

    (15件)

すべて 2020 2019 その他

すべて 国際共同研究 (2件) 雑誌論文 (4件) (うち国際共著 3件、 査読あり 4件) 学会発表 (8件) (うち国際学会 8件) 備考 (1件)

  • [国際共同研究] Sandia National Laboratories(米国)

    • 国名
      米国
    • 外国機関名
      Sandia National Laboratories
  • [国際共同研究] KAUST(サウジアラビア)

    • 国名
      サウジアラビア
    • 外国機関名
      KAUST
  • [雑誌論文] Lattice H-matrices for Massively Parallel Micromagnetic Simulations of Current-induced Domain Wall Motion2020

    • 著者名/発表者名
      Akihiro Ida, Tadashi Ataka and Atsushi Furuya
    • 雑誌名

      IEEE Transactions on Magnetics

      巻: 56 ページ: 1--4

    • DOI

      https://doi.org/10.1109/TMAG.2019.2959349

    • 査読あり
  • [雑誌論文] QR Factorization of Block Low-rank Matrices with Weak Admissibility Condition2019

    • 著者名/発表者名
      Akihiro Ida, Hiroshi Nakashima, Tasuku Hiraishi, Ichitaro Yamazaki, Rio Yokota, Takeshi Iwashita
    • 雑誌名

      Journal of Information Processing

      巻: 27 ページ: 831-839

    • DOI

      https://doi.org/10.2197/ipsjjip.27.831

    • 査読あり / 国際共著
  • [雑誌論文] Distributed Memory Lattice H-matrix Factorization2019

    • 著者名/発表者名
      Ichitaro Yamazaki, Akihiro Ida, Rio Yokota, Jack Dongarra
    • 雑誌名

      The International Journal of High Performance Computing Applications

      巻: online ページ: online

    • DOI

      https://doi.org/10.1177/1094342019861139

    • 査読あり / 国際共著
  • [雑誌論文] Extreme Scale FMM-Accelerated Boundary Integral Equation Solver for Wave Scattering2019

    • 著者名/発表者名
      Mustafa AbdulJabbar, Mohammed Al Farhan, Noha Al-Harthi, Rui Chen, Rio Yokota, Hakan Bagci, David Keyes
    • 雑誌名

      SIAM Journal on Scientific Computing

      巻: 4-3 ページ: C245--C268

    • DOI

      https://doi.org/10.1137/18M1173599

    • 査読あり / 国際共著
  • [学会発表] Numerical Linear Algebra Based on Lattice H-Matrices2020

    • 著者名/発表者名
      Akihiro Ida, Ichitaro Yamazaki, Rio Yokota, Satoshi Ohshima, Tasuku Hiraishi, Takeshi Iwashita, Tetsuya Hoshino, and Toshihiro Hanawa
    • 学会等名
      International Conference on High Performance Computing in Asia-Pacific Region (HPC Asia 2020)
    • 国際学会
  • [学会発表] Optimization of Numerous Small Dense-Matrix Vector Multiplications in H-matrix Arithmetic on GPU2019

    • 著者名/発表者名
      Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota
    • 学会等名
      Auto-Tuning for Multicore and GPU (ATMG) In conjunction with the IEEE MCSoC-19
    • 国際学会
  • [学会発表] Distributed Memory Task-Based Block Low Rank Direct Solver2019

    • 著者名/発表者名
      Sameer Deshmukh, Rio Yokota
    • 学会等名
      HPC Asia 2020 (poster)
    • 国際学会
  • [学会発表] QR Decomposition of Block Low-Rank Matrices2019

    • 著者名/発表者名
      Muhammad Ridwan Apriansyah, Rio Yokota
    • 学会等名
      HPC Asia 2020 (poster)
    • 国際学会
  • [学会発表] Runtime System for GPU-based Hierarchical LU factorization2019

    • 著者名/発表者名
      Qianxing Ma, Rio Yokota
    • 学会等名
      The International Conference for High Performance Computing, Networking, Storage, and Analysis (poster)
    • 国際学会
  • [学会発表] TSQR on TensorCores2019

    • 著者名/発表者名
      Hiroyuki Ootomo, Rio Yokota
    • 学会等名
      The International Conference for High Performance Computing, Networking, Storage, and Analysis (best poster candidate)
    • 国際学会
  • [学会発表] Tensorコアを用いたTSQR2019

    • 著者名/発表者名
      大友 広幸, 横田 理央
    • 学会等名
      日本応用数理学会年会
    • 国際学会
  • [学会発表] Application of the Fast Micromagnetic Simulation to Thin Spintronic Devices2019

    • 著者名/発表者名
      Tadashi Ataka, Akihiro Ida, Atsushi Furuya, Koichi Shimizu, Jun Fujisaki, Tomohiro Tanaka and Hirotaka Oshima
    • 学会等名
      22nd International Conference on the Computation of Electromagnetic Fields
    • 国際学会
  • [備考] 横田研究室webpage

    • URL

      https://www.rio.gsic.titech.ac.jp/jp/index.html

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi