• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2016 年度 実績報告書

FMMとH行列を組み合わせた大規模連立一次方程式の反復解法

研究課題

研究課題/領域番号 16H05859
研究機関東京工業大学

研究代表者

横田 理央  東京工業大学, 学術国際情報センター, 准教授 (20760573)

研究期間 (年度) 2016-04-01 – 2018-03-31
キーワード数値解法 / 反復法 / 前処理 / H行列 / FMM
研究実績の概要

平成28年度には、限られた偏微分方程式しか解くことのできない現在のFMMを一般的な偏微分方程式に適用できるH行列による連立一次方程式の解法へと拡張した。これは、FMMの多重極展開の部分を代数学的な低ランク近似に置き換えることで行った。この際にFMMが適用可能な問題についてはH行列をFMMに変換することでメモリの消費量を低減した。H行列はFMMにデータ構造や処理の流れが酷似しているため、ベースとなる高性能な実装であるexaFMMコードを開発している申請者のグループにおいては拡張は比較的容易に行なうことができた。また、FMMコードをベースにH行列のコードを開発することでマトリックスフリーなH行列の実装に成功した。これによりH行列の最も大きな欠点であったメモリ消費量を1/100程度に低減することができ、既存のH行列では解析が不可能な1兆自由度の境界要素法解析を実現した。
平成28年度の2つ目の課題であったH行列のLU分解に関しても、HACApKコードをBlock Low-Rank形式に変換することでPLASMAなどの密行列ライブラリに実装されているBlock LU分解の原理を用いて並列処理を行うことができた。従来のPLASMAと根本的に異なる点は一つ一つのブロックが低ランク近似されている点であり、これが大きな計算量、メモリ消費量の削減につながった。
当初の計画では平成29年度の課題であった、内部カーネルのチューニングも平成28年度に行うことができた。これはAbdullah国王科学技術大学(KAUST)とIntelとの共同研究によりFMMの内部カーネルのKnights Landing上でのチューニングが行われ、HiCMAプロジェクトの一環としてH行列の内部カーネルのKnights Landing上でのチューニングも行われた。その結果FMM、H行列ともにピークに近い性能を発揮できた。

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

申請時の研究計画では、平成28年度には「限られた偏微分方程式しか解くことのできない現在のFMMを一般的な偏微分方程式に適用できるH行列による連立一次方程式の解法へと拡張する」ことと「行列ーベクトル積しか計算することのできない本H行列実装をLU分解にまで拡張すること」の2つが目標であった。これらの2つの目標は達成され、期待していた通りの性能向上を得ることができたため、平成28年度の研究の進捗状況は良好であるといえる。FMMからH行列への拡張により、従来はPoisson方程式やHelmholtz方程式などのGreen関数解を有する偏微分方程式にしか適用できなかったものを、より一般的な偏微分方程式に適用できるようになった。これはH行列の観点から見るとAdaptive Cross Approximationやrandomized SVDなどの欠点をFMMを用いた圧縮を行うことで排除できることになる。
申請時の研究計画では、平成29年度の課題として設定していた「FMMやH行列の内部カーネルのチューニング」もKAUSTとIntelとの共同研究が予想以上に早く進んだことにより、平成28年度中に実現することができた。この点で本課題は当初の計画以上に進展しているといえる。残る課題としては「実アプリケーションにおけるマルチグリッド法との比較」があるが、こちらも既に実験の最終段階に入っており、KAUSTの博士課程の学生(申請者が指導)が中心となって論文を執筆中である。本課題の研究計画調書にもある通り、FMMとマルチグリッド法との直接比較は申請時の時点でできており、平成29年度に行うのはFMMとH行列のハイブリッド法とマルチグリッド法との比較である。ハイブリッド法ではFMMでは扱えないより一般的な偏微分方程式を対象とし、H行列ではメモリ不足になるような規模の計算においてマルチグリッド法と比較する。

今後の研究の推進方策

進捗状況の欄に述べたように本課題は当初の計画以上に進展しているため、申請時の研究計画調書で挙げた研究目標は平成29年度の前半に達成できる見込みである。そこで、平成29年度の後半では当初の研究計画には含まれていなかった「FMM、H行列ハイブリッド法のGPU上での最適化」と「H行列の機械学習への適用」を新たな追加目標として設定する。本課題では東工大のスパコンTSUBAMEの利用料を予算に計上しており、これを用いたマルチGPUによる高速化を行う環境は既に整備されている。また、平成29年の8月にはTSUBAMEが2.5から3.0にアップグレードされ、最新のPascal世代のGPUをNVLINKで相互に結合した何倍も高性能な計算機となる。この計算機環境を最大限に利用することで世界でも前例のない高性能・大規模なFMM・H行列の計算を行うことを目標とする。機械学習への応用に関しては、平成28年度の12月に採択されたJST CRESTの研究課題「社会インフラ映像処理のための高速・省資源深層学習アルゴリズム基盤」において平行して検証を行ってきており、FMMやH行列のような低ランク近似法が機械学習における密行列にも適用できることが確認できている。ただし、機械学習の密行列は辺長比が大きく、低ランク近似による圧縮率も入力データ、ネットワークの種類、層によって大きく変化することも確認されている。現在、機械学習では低精度(16bit)の浮動小数点演算を用いる試みがなされているが、肝心の密行列積はなんら近似を用いることなく行われており、多くの無駄な演算が行われている。本課題で提案する高速な低ランク近似法はこの密行列積の演算量を大幅に低減するものであり、機械学習の高速化に大いに役立つもと期待される。

  • 研究成果

    (17件)

すべて 2017 2016 その他

すべて 国際共同研究 (2件) 雑誌論文 (5件) (うち国際共著 3件、 査読あり 5件、 謝辞記載あり 2件) 学会発表 (9件) (うち国際学会 5件、 招待講演 2件) 備考 (1件)

  • [国際共同研究] Abdullah国王科学技術大学(サウジアラビア)

    • 国名
      サウジアラビア
    • 外国機関名
      Abdullah国王科学技術大学
  • [国際共同研究] Lawrence Berkeley国立研究所/George Washington大学(米国)

    • 国名
      米国
    • 外国機関名
      Lawrence Berkeley国立研究所/George Washington大学
  • [雑誌論文] Fast Multipole Preconditioners for Sparse Matrices Arising from Elliptic Equations2017

    • 著者名/発表者名
      H. Ibeid, R. Yokota, J. Pestana, D. Keyes
    • 雑誌名

      Computing and Visualization in Science

      巻: 印刷中 ページ: 印刷中

    • 査読あり / 国際共著
  • [雑誌論文] FMM と H^2(HSS) 行列のトレードオフについて2016

    • 著者名/発表者名
      横田理央
    • 雑誌名

      計算工学

      巻: 21 ページ: 3498-3501

    • 査読あり / 謝辞記載あり
  • [雑誌論文] 大規模境界要素法解析における分散並列FMMの通信最適化2016

    • 著者名/発表者名
      横田理央
    • 雑誌名

      シミュレーション

      巻: 35 ページ: 147-153

    • 査読あり / 謝辞記載あり
  • [雑誌論文] Multi-level Restricted Maximum Likelihood Covariance Estimation and Kriging for Large Non-gridded Spatial Datasets2016

    • 著者名/発表者名
      J. E. Castrillon-Candas, M. G. Genton, R. Yokota
    • 雑誌名

      Spatial Statistics

      巻: 18 ページ: 105-124

    • DOI

      10.1016/j.spasta.2015.10.006

    • 査読あり / 国際共著
  • [雑誌論文] A Performance Model for the Communication in Fast Multipole Methods on HPC Platforms2016

    • 著者名/発表者名
      H. Ibeid, R. Yokota, D. Keyes
    • 雑誌名

      International Journal of High Performance Computing Applications

      巻: 30 ページ: 423-437

    • DOI

      10.1177/1094342016634819

    • 査読あり / 国際共著
  • [学会発表] 低ランク近似行列によるCNNにおける畳み込み演算の最適化2017

    • 著者名/発表者名
      本山 義史,遠藤 敏夫,松岡 聡,横田 理央,福田 圭祐
    • 学会等名
      第158回ハイパフォーマンスコンピューティング研究発表会
    • 発表場所
      熱海
    • 年月日
      2017-03-08 – 2017-03-10
  • [学会発表] 低ランク近似を用いた深層学習の行列積の高速化2017

    • 著者名/発表者名
      関谷 翠,大沢 和樹,長沼 大樹,横田 理央
    • 学会等名
      第158回ハイパフォーマンスコンピューティング研究発表会
    • 発表場所
      熱海
    • 年月日
      2017-03-08 – 2017-03-10
  • [学会発表] Compute-Memory Tradeoff in Hierarchical Low-Rank Approximation Methods2017

    • 著者名/発表者名
      R. Yokota
    • 学会等名
      SIAM Conference on Computational Science and Engineering
    • 発表場所
      Atlanta, USA
    • 年月日
      2017-02-27 – 2017-03-03
    • 国際学会
  • [学会発表] Energy Conservation of Fast Multipole Methods in Classical Molecular Dynamics Simulations2017

    • 著者名/発表者名
      R. Yokota
    • 学会等名
      7th AICS International Symposium
    • 発表場所
      神戸
    • 年月日
      2017-02-24 – 2017-02-25
    • 国際学会 / 招待講演
  • [学会発表] Tapas: An Implicitly Parallel ProgrammingFramework For Hierarchical N-body Algorithms2016

    • 著者名/発表者名
      K. Fukuda, M. Matsuda, N. Maruyama, R. Yokota, K. Taura, S. Matsuoka
    • 学会等名
      The 22nd IEEE International Conference on Parallel And Distributed Systems, The 22nd IEEE International Conference on Parallel And Distributed Systems
    • 発表場所
      Wuhan, China
    • 年月日
      2016-12-13 – 2016-12-16
    • 国際学会
  • [学会発表] Improving Data Locality of Fast Multipole Methods2016

    • 著者名/発表者名
      R. Yokota
    • 学会等名
      Third Workshop on Programming Abstractions for Data Locality
    • 発表場所
      神戸
    • 年月日
      2016-10-24 – 2016-10-26
    • 国際学会 / 招待講演
  • [学会発表] Fast Multipole Method を用いた多種アーキテクチャ向け スーパーコンピュータ用ライブラリの開発と 分子・流体シミュレーションでの評価2016

    • 著者名/発表者名
      横田理央
    • 学会等名
      学際大規模情報基盤共同利用・共同研究拠点 第8回シンポジウム
    • 発表場所
      品川
    • 年月日
      2016-07-14 – 2016-07-15
  • [学会発表] FMMの性能の可搬性2016

    • 著者名/発表者名
      横田理央
    • 学会等名
      第21回計算工学講演会
    • 発表場所
      新潟
    • 年月日
      2016-05-31 – 2016-06-02
  • [学会発表] A Matrix-Free Preconditioner for Elliptic Solvers Based on the Fast Multipole Method2016

    • 著者名/発表者名
      H. Ibeid, R. Yokota, D. Keyes
    • 学会等名
      SIAM Conference on Parallel Processing for Scientific Computing
    • 発表場所
      Paris, France
    • 年月日
      2016-04-12 – 2016-04-15
    • 国際学会
  • [備考] 階層的低ランク近似

    • URL

      http://www.rio.gsic.titech.ac.jp/jp/research/index.html

URL: 

公開日: 2018-01-16   更新日: 2022-01-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi