Project/Area Number |
21K11930
|
Research Category |
Grant-in-Aid for Scientific Research (C)
|
Allocation Type | Multi-year Fund |
Section | 一般 |
Review Section |
Basic Section 60100:Computational science-related
|
Research Institution | Matsue National College of Technology |
Principal Investigator |
岩澤 全規 松江工業高等専門学校, 情報工学科, 准教授 (10650038)
|
Co-Investigator(Kenkyū-buntansha) |
牧野 淳一郎 神戸大学, 理学研究科, 特命教授 (50229340)
細野 七月 神戸大学, 理学研究科, 特命助教 (70736298)
|
Project Period (FY) |
2021-04-01 – 2025-03-31
|
Project Status |
Granted (Fiscal Year 2023)
|
Budget Amount *help |
¥4,290,000 (Direct Cost: ¥3,300,000、Indirect Cost: ¥990,000)
Fiscal Year 2023: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2022: ¥1,040,000 (Direct Cost: ¥800,000、Indirect Cost: ¥240,000)
Fiscal Year 2021: ¥2,210,000 (Direct Cost: ¥1,700,000、Indirect Cost: ¥510,000)
|
Keywords | 粒子シミュレーション / 高性能計算 / フレームワーク / 粒子法 / gpu / 天文学 |
Outline of Research at the Start |
FDPSがこれまでホストコンピュータで行ってきた、ツリー構造の構築や相互作用リストの作成など、通信以外のあらゆる部分をアクセラレータ上で動作するようFDPSに実装し、アクセラレータ搭載スパコンでも実行性能の高い粒子シミュレーションコード開発を容易にする。
|
Outline of Annual Research Achievements |
粒子法シミュレーションは自然科学や工学の様々な分野で使われている.しかし,並列粒子シミュレーションプログラムの開発は容易ではなく,多くの研究者がプログラムの開発,最適化に膨大な時間を割く必要がある.そこで、我々は並列粒子シミュレーションプログラムを容易に開発するためのフレームワークFDPS(Framework For Developing Particle Simulators)を開発した.本研究課題ではFDPSをGPGPU等のアクセラレータ上で効率的に動作するようなアクセラレータ対応FGDPSの開発を行う. 当該年度ではTree法によるN体シミュレーションコードを,粒子シミュレーションコード開発用のフレームワークである FDPSを用いて実装し性能測定を行った.重力計算はNVIDIAのGPGPU 上で行い,それ以外の木構造や相互作用リストの構築はホスト計算機上で行った.計算の効率化のため,GPGPU 上での重力計算,およびホストでの相互作用リスト構築,ホスト-GPGPU 間の通信はオーバーラップさせた.性能測定はGPGPUとしてRTX4090,CPUとしてAMD RYZEN9 7950x3dを搭載した計算機上で行った.粒子数は16M,ツリーの見込み角は0.3とした.結果,計算速度11.23Tflopsを達成し,また,消費電力当たりの性能は単精度の計算で35.8GFlops/W(倍精度換算で17.9Gflops/W)の性能を実現した.
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
当該年度はGPGPU+ホスト計算機による計算手法を最新のGPGPUに実装,最適化を施したため,並列tree法をGPGPUに実装するまでには至っておらず,開発に遅れが生じてしまっている.
|
Strategy for Future Research Activity |
並列化ツリー法をNVIDIAのGPGPU上で動作するようにCUDAで実装を行う.その後,様々なアプリケーションによる性能測定を行い,最終的にはGPGGPUを搭載した大規模なスパコン上で性能測定を行いたい.
|