| Project/Area Number |
23K11123
|
| Research Category |
Grant-in-Aid for Scientific Research (C)
|
| Allocation Type | Multi-year Fund |
| Section | 一般 |
| Review Section |
Basic Section 60090:High performance computing-related
|
| Research Institution | The University of Tokyo |
Principal Investigator |
三木 洋平 東京大学, 情報基盤センター, 准教授 (70734375)
|
| Project Period (FY) |
2023-04-01 – 2026-03-31
|
| Project Status |
Granted (Fiscal Year 2024)
|
| Budget Amount *help |
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2024: ¥1,430,000 (Direct Cost: ¥1,100,000、Indirect Cost: ¥330,000)
Fiscal Year 2023: ¥1,820,000 (Direct Cost: ¥1,400,000、Indirect Cost: ¥420,000)
|
| Keywords | GPUを用いた演算加速 / 高性能計算 / 計算科学 / 性能最適化 / ベンダーロックイン / 性能可搬性 |
| Outline of Research at the Start |
近年導入されるスーパーコンピュータには,高い演算性能と少ない消費電力量という相反する需要を両立するため,演算加速器としてGPUが搭載されることが多くなってきた.GPUスパコンを最大限活用するためには,GPUの高い演算性能を引き出すことのできるソフトウェアの存在が必要不可欠である.また,GPU提供ベンダーについても多様化が進みつつあり,同時にソフトウェア開発環境の多様化も進行している.本研究では多様化するGPU環境に対応できる開発・性能最適化手法の確立と実アプリケーションへの展開を目指す.
|
| Outline of Annual Research Achievements |
主要なGPUベンダーであるNVIDIA,AMD,Intelの3社全てのGPUに対応し,かつ十分な性能を発揮するコードを実装できる開発環境を調べるために,各社が直接サポートするプログラミングモデルであるCUDA,HIP,SYCLを用いて直接法に基づく重力多体計算コードを実装・最適化した. NVIDIA H100,NVIDIA GH200,AMD Instinct MI210,Intel Data Center GPU Max 1100上での性能評価を行った結果として,SYCLを用いた実装が全GPU上で高い性能を発揮する,つまり高い性能可搬性があることが分かった.こうした結果は査読付き論文誌に投稿済みであり,また国際ワークショップなどでも報告している. CUDA/HIP/SYCLよりも簡易なGPUプログラミング手法としてOpenACCやOpenMP のターゲット指示文といった指示文を用いた実装が広く用いられている.しかし,OpenACCは実質的にNVIDIA製GPU専用の指示文となりつつある一方で,NVIDIA/AMD/Intel全社がサポートするOpenMP についてはOpenACC に比べて機能が不足しており,両者は一長一短の関係にある.そこで本研究ではC/C++言語のプリプロセッサを活用することでOpenACCとOpenMPのターゲット指示文を統合して使用できるライブラリSolomon(Simple Off-LOading Macros Orchestrating multiple Notations)を開発した.この成果はMiki & Hanawa (2024, IEEE Access, 12, 181644)として出版済みであり,またライブラリはGitHubにおいて公開した(https://github.com/ymiki-repo/solomon).
|
| Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
当初の計画では,2024年度中にSYCL実装および性能評価を完了させることになっており,論文投稿に至ったことからもこれは達成済みと評価できる.さらに,2025年度前半に予定されていたOpenMP実装の性能評価がすでに完了しており,同じく2025年度前半に着手予定であったKokkos実装にも取り組み始めている.特にOpenMP実装においては,当初計画には含まれていなかったOpenACCとOpenMPのターゲット指示文のインタフェースを統合するライブラリの実装に成功し,オープンソースソフトウェアとしての公開にも至っている.以上の内容から,当初の計画以上に進展していると評価できる.
|
| Strategy for Future Research Activity |
国際的に広く用いられている性能可搬ライブラリKokkos を用いた実装および性能評価を進めていき,特に本研究によって性能可搬性が高いことが分かってきたSYCL との比較を計画しており,本課題の終了時点である2025年度中の完了を目標とする.これは当初計画されていた研究内容を予定通りに遂行するという内容であり,現段階では当初計画よりも早いスケジュールで研究が進捗しているため,十分に実現可能だと考えている.
|