研究課題/領域番号 |
21K11923
|
研究機関 | 慶應義塾大学 |
研究代表者 |
渡辺 宙志 慶應義塾大学, 理工学部(矢上), 准教授 (50377777)
|
研究期間 (年度) |
2021-04-01 – 2026-03-31
|
キーワード | 分子動力学法 / 並列化 / ロードバランシング |
研究実績の概要 |
近年の計算機は階層化、複雑化が進んでおり、その性能を活用するためのプログラム開発労力は大きくなっている。特に問題となるのが、年々増え続けるSIMD幅への対応と、分散メモリ環境における並列化効率である。富岳は512ビットのSIMD幅を持つアーキテクチャを持ち、64ビットの倍精度実数8要素同時に計算することができる。しかし、そもそもループ長が短い短距離分子動力学法において、このSIMD幅を活用できるかどうか、データレイアウトはどのようなものが良いかは非自明であった。そこで富岳における短距離分子動力学法コードの性能を調べるため、Lennard-Jonesポテンシャルの力の計算カーネルのベンチマークを行った。他のアーキテクチャでは大きな差が出やすいAoS/SoAのデータ構造の違いは、富岳では大きな差として現れなかった。「京」の場合と同様に作用反作用を用いない最適化が有効であり、計算量が2倍になるかわりに、計算時間が40%程度となった。その結果、ピーク性能比は4.8倍となったが、これは実アプリにおけるピーク性能比の向上率にほぼ等しい。また、超並列環境におけるロードバランシングアルゴリズムについて検討を行った。ロードバランシングアルゴリズムとして広く用いられているGlobal Sort法では、全粒子情報を一度まとめる必要があるため、大規模計算ではメモリ枯渇の恐れがある。そこで、局所的な情報をもとに負荷を調整する手法として、ボロノイ分割による領域分割アルゴリズムを検討した。液滴系について性能を調査したところ、Global Sort法ではほぼ理想的な負荷バランスが実現しているのにたいして、ボロノイ分割アルゴリズムではそれより3%程度効率が落ちるにとどまり、超並列環境において、省メモリと高性能を両立できる見通しを得た。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
2: おおむね順調に進展している
理由
本研究課題の目標は、超並列計算の能力を活用するためのフレームワークの構築である。そのためには計算ノードにまたがる分散メモリ並列、及び、CPUコア内のSIMD化を検討する必要がある。粒子系の並列化で問題となるロードバランシングについて新たな知見を得た上、富岳において効率的なSIMD性能を持つコードの検討を行っており、本研究課題の目的の実現に必要な要素技術の検討は順調であるといえる。
|
今後の研究の推進方策 |
SIMD化については作用反作用を用いないことにより、富岳のピーク性能比が1.75%から8.97%まで向上したが、短距離分子動力学法では概ね15%から20%程度の性能が求められる。今後はSVE命令を明示的に用いた最適化に取り組み、その上で最適なコードを自動生成できるフレームワークの開発を目指す。並列化については、自作の並列分子動力学法コードにボロノイ分割アルゴリズムを実装し、実アプリにおける性能向上を確認する。
|
次年度使用額が生じた理由 |
購入予定であったファイルサーバが予定額よりも安価であったため。差額の4330円は返納予定。
|