Study of high performance and accuracy eigenvalue solvers for quantum many-body systems
Project/Area Number |
22K12052
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60090:High performance computing-related
|
Research Institution | Japan Atomic Energy Agency |
Principal Investigator |
山田 進 国立研究開発法人日本原子力研究開発機構, システム計算科学センター, 研究主幹 (80360436)
|
Co-Investigator(Kenkyū-buntansha) |
永井 佑紀 東京大学, 情報基盤センター, 准教授 (20587026)
町田 昌彦 国立研究開発法人日本原子力研究開発機構, システム計算科学センター, 研究主席 (60360434)
宇都野 穣 国立研究開発法人日本原子力研究開発機構, 原子力科学研究部門 原子力科学研究所 先端基礎研究センター, 研究主席 (10343930)
|
Project Period (FY) |
2022-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥3,900,000 (Direct Cost: ¥3,000,000、Indirect Cost: ¥900,000)
Fiscal Year 2024: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
Fiscal Year 2023: ¥1,170,000 (Direct Cost: ¥900,000、Indirect Cost: ¥270,000)
Fiscal Year 2022: ¥910,000 (Direct Cost: ¥700,000、Indirect Cost: ¥210,000)
|
Keywords | 高性能計算 / 固有値計算 / LOBPCG法 / 量子多体問題 / 複数固有値 / 量子問題 / 高精度化 |
Outline of Research at the Start |
量子効果の強い物理モデルは、そのエネルギーを表現する行列を固有値計算することでその物性を知ることができるが、行列の次元はモデルサイズの拡大に伴って増加する。一方で、計算機の進歩により大きな問題の計算が可能になってきたが、計算機の構造は複雑化し、高速に計算するためには、その構造に合わせたアルゴリズムを用いる必要がある。そこで、計算科学研究者と物理研究者が協力して、問題の規則性を見つけ出し、最新の計算機上で高精度・高速なシミュレーションを可能にするアルゴリズムを提案する。さらに、開発したアルゴリズムを用いて実際の物理問題を計算し、物理的な知見を得ることも目指す。
|
Outline of Annual Research Achievements |
本研究では、量子多体問題から導かれるハミルトニアンの固有値およびそれに対応した固有ベクトルを高速に計算することを目標としている。 令和5年度は、約20年前に当時世界最速の計算機であった(初代)地球シミュレータでLOBPCG法を用いてこの固有値問題計算した際の計算性能と現在の計算機で実行した計算性能の比較を行った。最近の大型計算機に採用されているCPUの計算性能は向上しているため、1ノードでの計算では、現在の計算機のほうが高速に計算できることが確認できた。一方、地球シミュレータはクロスバー構造のネットワークで接続されているため、並列数が増えても通信性能が劣化しにくい。そのため、ノード数(並列数)が多くなると地球シミュレータのほうが高速に計算できていたことが確認できた。このことから、現在の計算機の性能を有効に利用するためには、多少計算量が増えても少ない通信量のアルゴリズムを採用することが重要であることが示せた。 また、GPU計算機を用いて大規模な問題をLOBPCG法で計算する際に、GPU側のメモリ(デバイスメモリ)だけでなくCPU側のメモリ(ホストメモリ)も利用する計算方法を研究した。GPUで計算する際にはデータをデバイスメモリに格納する必要があるが、そのサイズはホストメモリよりも小さい。そのため、デバイスメモリだけでなくホストメモリも用いることでより大規模な問題が計算できることになるが、ホストメモリに格納したデータをGPUでの計算に用いる際にはメモリ間でのデータ転送が必要になる。このデータ転送と演算を同時に実行することでデータの転送のコストを隠ぺいするとともに、一部の計算をCPUで計算する方法を提案した。実際にGPU計算機で計算したところ大規模な問題を高速に計算することが可能であることが確認できた。
|
Current Status of Research Progress |
Current Status of Research Progress
2: Research has progressed on the whole more than it was originally planned.
Reason
当初の計画通りに、GPU計算機を用いて計算する際に、GPUとCPU間のデータの転送と演算を同時に実行することでデータの転送コストを隠ぺいするとともに、すべての演算をGPUで行うのではなく一部をCPUで行うことにより、LOBPCG法の計算の高速化や大規模化を実現していることから、研究は順調に進んでいると考えている。
|
Strategy for Future Research Activity |
これまでよりも大規模な計算機に、開発した高速化・並列化方法を適用し、その有効性を確認するとともに、大規模な計算機用の計算アルゴリズムの研究開発を進めていく。特に、計算機が大規模化すると問題になる通信コストを抑えるための研究開発を中心に実施する。また、LOBPCG法を用いて複数固有値を求める際に、計算誤差が累積して計算が破綻することがあるため、誤差が累積しにくい計算アルゴリズムの研究開発を行い、LOBPCG法の安定性の向上を目指す。さらに、開発したコードを実際の量子問題に適用し、新たな物理的知見を得ることを目指す。
|
Report
(2 results)
Research Products
(4 results)