研究課題/領域番号 |
21H03447
|
研究機関 | 国立研究開発法人海洋研究開発機構 |
研究代表者 |
伊田 明弘 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 主任研究員 (80742121)
|
研究分担者 |
横田 理央 東京工業大学, 学術国際情報センター, 教授 (20760573)
塙 敏博 東京大学, 情報基盤センター, 教授 (30308283)
岩下 武史 北海道大学, 情報基盤センター, 教授 (30324685)
大島 聡史 九州大学, 情報基盤研究開発センター, 准教授 (40570081)
星野 哲也 名古屋大学, 情報基盤センター, 准教授 (40775946)
平石 拓 京都橘大学, 工学部, 専任講師 (60528222)
|
研究期間 (年度) |
2021-04-01 – 2024-03-31
|
キーワード | 近似計算 / 低ランク / H行列法 / 数値線形代数 / 行列近似 / 高性能計算 / 並列計算 / アルゴリズム |
研究実績の概要 |
格子H行列に関連する低ランク構造行列法のアルゴリズムの研究・開発を行った。格子H行列の特殊な場合である対称ブロック低ランク(BLR)行列について、近似的な全固有値・固有ベクトルを求めるための数学理論を提案し、具体的な計算手法を開発した。この手法で計算した近似固有値・固有ベクトルの計算精度を保証するための数学的理論を提案し、数値実験を用いて検証した。 格子H行列法の適用範囲の拡大に取り組んだ。格子H行列法コードHACApKを適用した地震周期解析コードHBIに対して、MPI+OpenMPハイブリッド並列計算の最適化を行った。最適化コードを用いて、日本列島中央構造線の大規模地震周期シミュレーションを実施した。また、三次元波動解析へ格子H行列法を適用する理論および数値計算法のプロトタイプを考案した。 格子H行列法の高性能実装に関する研究を実施した。タスク並列化言語Tascellに効率的なワークスチール機能を追加し、分散メモリ並列計算機上でのH行列分割生成および低ランク構造行列生成の計算性能を向上させることに成功した。また、最新CPUアーキテクチャを用いた計算ノード(AMD EPYC、Fujitusu A64FX、Intel Xeon Cascade Lake)で、H行列・ベクトル積計算を効率的に行うための手法を開発した。開発手法の計算性能(FLOPS換算)は、全種類のCPUノードでの理論的限界値の85%以上の性能を達成した。さらに、最新GPUのMIG機能を用いて、BLR行列に対するQR分解高速に行う手法を開発した。性能評価結果、MIGを用いることでMIGを用いない場合よりも実行時間を78%短縮できた。使用メモリは密行列(5万元)の場合の約10%に低減された。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究は格子H行列に対し、(1)数値計算アルゴリズムの研究開発、(2)適用範囲拡大の研究、(3)高性能実装法に関する研究、の3つの研究項目に大別される。研究項目(1)については、固有値計算法および計算精度保証に関する新しいアルゴリズムを提案し、1本の査読付き学術誌論文および2件の学会発表を行った。研究項目(2)については、地震周期解析へ格子H行列法を適用する研究成果を元に、1件の国際会議発表と1本の学術誌論文を発表した。また、三次元波動解析へ格子H行列法適用法の関する研究では、2件の学会発表を行った。研究項目(3)については、タスク並列言語を用いた格子H行列法生成の動的負荷分散に関する研究で、2本の査読付き学術誌論文を発表した。また、最新CPU上での格子H行列ベクトル積計算法に関する研究、および、GPU上のMIG機能を用いたBLR行列QR分解に関する研究で、それぞれ1本ずつの査読付き学術誌論文を発表した。 全ての研究項目について、多くの研究成果が得られており、おおむね順調に進展している。
|
今後の研究の推進方策 |
格子H行列に関連する低ランク近似手法の数値計算アルゴリズムについて、これまでに行った固有値計算法、LU分解法、QR分解法の研究開発を引き続き実施する。BLR行列の全固有値計算法の並列化アルゴリズムを開発する。ブロック三重対角化を用いた全固有値計算手法に加えて、指定した範囲内にある中間固有値を低ランク近似行列のLU分解に基づき計算する手法の開発を行う。また、格子H行列の分割構造を、補助情報(座標情報など)を用いず、行列要素情報のみから構築する数学的手法を研究する。 格子H行列の適用対象拡大の研究に関しては、動的破壊シミュレーションに用いられる数値計算手法であるFDPM法と格子H行列法を組み合わせた新手法を地震波伝搬問題に適用する。また、MRI検査装置などに用いられるコイルの配位最適化計算に現れる長方行列に対して、低ランク近似手法を適用する研究を実施する。 高性能実装法に関する研究に関しては、格子H行列ベクトル積計算を分散メモリ並列計算システム上でMPI/OpenMPハイブリッド並列で実行する際に、MPIプロセスごとに異なる数のOpenMPスレッドを割り当てる機構を開発する。この機構において、量子アニーラを用いて最適配分を予測する手法についても取り組む。また、格子H行列ベクトル積計算のGPU化、最新CPU上最適化、FPGA向け実装法の研究を実施する。
|