研究課題/領域番号 |
17H01749
|
研究機関 | 東京大学 |
研究代表者 |
伊田 明弘 東京大学, 情報基盤センター, 特任准教授 (80742121)
|
研究分担者 |
横田 理央 東京工業大学, 学術国際情報センター, 准教授 (20760573)
岩下 武史 北海道大学, 情報基盤センター, 教授 (30324685)
大島 聡史 九州大学, 情報基盤研究開発センター, 助教 (40570081)
平石 拓 京都大学, 学術情報メディアセンター, 助教 (60528222)
|
研究期間 (年度) |
2017-04-01 – 2020-03-31
|
キーワード | 近似計算 / 低ランク / H行列 / ライブラリ / アルゴリズム / 並列計算 / 高性能計算 / ハイパフォーマンスコンピューティング |
研究実績の概要 |
H行列法ライブラリHACApKの高機能化を目的とし、次の5項目について研究を行った。 (1)本研究で開発した格子H行列について、分散メモリ並列計算システム上で行列・ベクトル積計算を行う際のベクトル分散法を開発した。開発手法を実アプリ(マイクロマグネティクス計算コード)で実装し、性能評価を行った。3,600プロセスを用いた並列計算において、既存のHACApKを用いた計算に比べ10倍以上の高速化効果が得られた。(2)多重極展開・局所展開の変換行列を保存しインタラクションの対称性を利用してGEMMに落とし込む手法を実装した。また、そのGPU実装も完了することができた。これにより、現在世界最速のFMM実装を実現することができた。HACApKとの統合は完了していないが、これで統合の準備は整ったといえる。(3) GPUを用いた高速なH行列計算法の実装に取り込んだ。特に、H行列を用いた連立一次方程式の解法において重要である、H行列ベクトル積に必要な多数の小密行列ベクトル積をGPU上で高速に行う実装法を開発した。得られた成果を査読付き国際会議等にて発表した。(4) H行列ベクトル積の高速化について、混合精度演算を用いる方法について研究を行った。H行列の部分行列の一部を単精度化する方法に加えて、低ランク部分行列のための新たなデータ構造を提示し、さらに本データ構造に基づいて、部分行列のデータを適切に混合精度化する方法を提案した。提案した手法を境界要素解析上で評価し、その有効性を確認した。(5) H行列の分割構造生成処理の動的負荷分散による並列実装の成果を学会・論文誌上で公開し、複数の学会で発表賞を受賞するなど高い評価を得た。さらなる性能改善にも取り組み、特に、複数のCPUコアによるキャッシュの取り合いにより性能が低下していた問題を改善することで、従来実装より約1.6倍の性能向上を実現した。
|
現在までの達成度 (段落) |
令和元年度が最終年度であるため、記入しない。
|
今後の研究の推進方策 |
令和元年度が最終年度であるため、記入しない。
|