• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2017 年度 実績報告書

FMMとH行列を組み合わせた大規模連立一次方程式の反復解法

研究課題

研究課題/領域番号 16H05859
研究機関東京工業大学

研究代表者

横田 理央  東京工業大学, 学術国際情報センター, 准教授 (20760573)

研究期間 (年度) 2016-04-01 – 2018-03-31
キーワードH行列 / FMM / GPU / LU分解
研究実績の概要

平成28年度には、限られた偏微分方程式しか解くことのできない現在のFMMを一般的な偏微分方程式に適用できるH行列による連立一次方程式の解法へと拡張した。これはFMMの多重極展開の部分を代数学的な低ランク近似に置き換えることで行った。この際にFMMが適用可能な問題についてはH行列をFMMに変換することでメモリの消費量を低減した。この際に用いるFMMは多重極展開には依存しないkernel independent FMMを採用し、Green関数解を持たない偏微分方程式にも適用できるように拡張した。これにより、統計学で用いられるGaussianカーネルやMaternカーネルにもFMMを適用することができるようになった。また、これらのFMMをCUDA、MPIにより実装しオープンソースライブラリExaFMMとしてウェブ上に公開した。コードのチューニングはGPU上でだけでなく、Xeon Phiなどでも内部カーネルのチューニングを行い、理論ピーク性能に近い性能を実現することができた。
平成29年度には、線形代数カーネルのチューニングの専門家と協力しH行列の内部カーネルのチューニングを行った。連携研究者であるテネシー大学の山崎研究員の協力のもとで小さな密行列をまとめて高速にGPU上で処理するためのbatched MAGMAによる実装を行った。これにより、従来のH行列のGPU実装に比べて10倍以上高速な実装を実現することができた。
また、流体解析、電磁界解析、機械学習の各アプリケーションごとにパラメータのチューニングを行い、FFTW のような使いやすい標準インターフェイスを構築した。上記の3つの性質の異なるアプリケーションについてH行列とmultigrid法の比較を行う予定であったが、この点については現時点でまだ調査中である。

現在までの達成度 (段落)

29年度が最終年度であるため、記入しない。

今後の研究の推進方策

29年度が最終年度であるため、記入しない。

  • 研究成果

    (11件)

すべて 2018 2017 その他

すべて 国際共同研究 (2件) 雑誌論文 (1件) (うち国際共著 1件、 査読あり 1件、 オープンアクセス 1件) 学会発表 (8件) (うち国際学会 7件、 招待講演 1件)

  • [国際共同研究] KAUST(サウジアラビア)

    • 国名
      サウジアラビア
    • 外国機関名
      KAUST
  • [国際共同研究] Lawrence Berkeley National Laboratory/University of Tennessee(米国)

    • 国名
      米国
    • 外国機関名
      Lawrence Berkeley National Laboratory/University of Tennessee
  • [雑誌論文] Fast multipole preconditioners for sparse matrices arising from elliptic equations2017

    • 著者名/発表者名
      Ibeid Huda、Yokota Rio、Pestana Jennifer、Keyes David
    • 雑誌名

      Computing and Visualization in Science

      巻: 18 ページ: 213~229

    • DOI

      10.1007/s00791-017-0287-5

    • 査読あり / オープンアクセス / 国際共著
  • [学会発表] Analyzing Performance of BiCGStab with Hierarchical Matrix on GPU clusters2018

    • 著者名/発表者名
      Ichitaro Yamazaki, Ahmad Abdelfattah, Akihiro Ida, Satoshi Ohshima, Stanimire Tomov, Rio Yokota, Jack Dongarra
    • 学会等名
      32nd IEEE International Parallel & Distributed Processing Symposium
    • 国際学会
  • [学会発表] Optimization of Hierarchical Matrix Computation on GPU2018

    • 著者名/発表者名
      Satoshi Ohshima, Ichitaro Yamazaki, Akihiro Ida, Rio Yokota
    • 学会等名
      SC Asia
    • 国際学会
  • [学会発表] Performance Evaluation of Computation and Communication Kernels of the Fast Multipole Method on Intel Manycore Architecture2017

    • 著者名/発表者名
      Mustafa AbdulJabbar, Mohammed Al Farhan, Rio Yokota, David Keyes
    • 学会等名
      3rd International European Conference on Parallel and Distributed Computing
    • 国際学会
  • [学会発表] Communication Reducing Algorithms for Distributed Heirarchical N-Body Methods2017

    • 著者名/発表者名
      Mustafa AbdulJabbar, George Markomanolis, Huda Ibeid, Rio Yokota, David Keyes
    • 学会等名
      32nd International Conference, ISC High Performance
    • 国際学会
  • [学会発表] GPUクラスタ上における階層型行列計算の最適化2017

    • 著者名/発表者名
      大島 聡史, 山崎 市太郎, 伊田 明弘, 横田理央
    • 学会等名
      Summer United Workshops on Parallel, Distributed and Cooperative Processing
  • [学会発表] Hierarchical Low-Rank Approximations at Extreme Scale2017

    • 著者名/発表者名
      Rio Yokota
    • 学会等名
      32nd International Conference, ISC High Performance
    • 国際学会 / 招待講演
  • [学会発表] Compute-Memory Tradeoff in Hierarchical Low-Rank Approximation Methods2017

    • 著者名/発表者名
      Rio Yokota
    • 学会等名
      SIAM Conference on Computational Science and Engineering
    • 国際学会
  • [学会発表] Energy Conservation of Fast Multipole Methods in Classical Molecular Dynamics Simulations2017

    • 著者名/発表者名
      Rio Yokota
    • 学会等名
      7th AICS International Symposium
    • 国際学会

URL: 

公開日: 2018-12-17   更新日: 2022-05-23  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi