研究課題/領域番号 |
17K19962
|
研究機関 | 東京大学 |
研究代表者 |
伊田 明弘 東京大学, 情報基盤センター, 特任准教授 (80742121)
|
研究期間 (年度) |
2017-06-30 – 2021-03-31
|
キーワード | 固有値 / 近似計算 / 低ランク / H行列 / 並列計算 / アルゴリズム |
研究実績の概要 |
科学技術計算に必要な大規模行列の全固有値を効率的に計算することを目的とし、低ランク行列表現に基づく固有値計算手法および同手法並列化アルゴリズムの研究開発を進めている。前年度までは、ハウスホルダー変換より対象行列を三重対角行列化する方針とQR法により固有値計算を行う方針の二本立てで研究を行っていたが、2019年度からは前者を断念し後者に専念することにした。前者を断念した理由は、固有値の相対誤差が10万元程度行列サイズで要求精度に達しない問題を解決できそうにないこと、および、並列化アルゴリズムの開発に見通しが立たなかったことの2点である。 BLR行列(低ランク行列表現の一種)に対してブロック修正グラムシュミット法を適用し、計算コストO(N^2)でQR分解を行う手法を開発した(密行列ではO(N^3))。その結果、32GBのメモリを持つ単一ノード上で、N=338,000の行列の近似QR因数分解を実現した。さらに、開発した手法の並列化アルゴリズムを提案し、MPI+OpenMPハイブリッドプログラミングモデルを用いて実装を行った。提案アルゴリズムは、BLR行列のシンプルな構造と負荷分散のためのブロックサイクリック割り当て戦略を駆使したものであり、少なくとも140コアまでの並列スケーラビリティを確認することができた。 140コアを使用した場合の最速計算時間は、逐次計算時間の約1/20倍であった。さらなる計算時間の短縮のために、ブロック列内の演算を並列化させる2Dサイクリック割当て戦略を導入する予定である。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
3: やや遅れている
理由
これまでの研究により、大規模行列の全固有値計算を分散メモリ並列計算システム上で行う手法として、本研究の一環として開発された格子H行列法(または簡略版であるBLR法)が有望であり、固有値計算手法としてはQR法が有望であるとの知見を得た。QR法の前段階であるQR分解を、BLR行列に対してブロック修正グラムシュミット法を用いて並列計算を行うアルゴリズムの開発・実装を行い、数値実験を行った。行列サイズが十万程度までは、想定内の誤差で計算することができるが、数十万元程度まで行列サイズを大きくすると、分解後の直交行列の直交性が悪化することが分かった。この問題を解決しなければQR法を実装したとしても、求める精度での固有値計算ができないことが予想される。一連の研究について、国内学会2回および国際学会2回で研究成果の発表を行い、査読付き国際会議投稿した論文1本および査読付き論文2本が採択された。 固有値計算まで研究開発が進んでおらず、当初計画よりやや遅れているため、一年間の研究期間延長を申請した。
|
今後の研究の推進方策 |
提案したBLR行列のブロック修正グラムシュミット法よるQR分解において、行列サイズを数十万元程度まで大きくした際に、分解後の直交行列Qの直交性が悪化する問題の解決に取り組む。低ランクブロック行列のランクを分解途中で大きくする手法やグラムシュミット反復を複数回実行するなど、いくつかの対策を立てており、それらを実施していく。この問題の解決の後に、QR法を実装し固有値計算に取り掛かる。固有値の計算精度が許容範囲内であることを確かめられれば、BLR行列に対するQR法の分散メモリ並列化アルゴリズムを開発する。その後、さらなる計算時間の短縮とメモリ使用量の低減を目指して、格子H行列に対するQR法の開発に取り組む。
|
次年度使用額が生じた理由 |
アルゴリズム開発に予想より多くの時間がかかり、予定していたスーパーコンピュータを用いた大規模並列計算が十分に行えなかった。その他の諸事情(計算機の混雑など)も加わり、計算機の使用量が予定より大幅に少なく、計算機使用料が予算より大幅に少なく済んだ。また、年度末に参加を予定しいた国際会議がコロナウイルスの世界的パンデミックにより中止となり、関連する諸経費(旅費など)を執行できなかった。 今年度に大規模計算を実施する予定のため、計算機使用料を当初予算に上乗せする。大型計算機の混雑への対策として、研究室に計算機を導入する費用に充てる。
|