Project/Area Number |
20H00580
|
Research Category |
Grant-in-Aid for Scientific Research (A)
|
Allocation Type | Single-year Grants |
Section | 一般 |
Review Section |
Medium-sized Section 60:Information science, computer engineering, and related fields
|
Research Institution | The University of Tokyo |
Principal Investigator |
塙 敏博 東京大学, 情報基盤センター, 教授 (30308283)
|
Co-Investigator(Kenkyū-buntansha) |
下川辺 隆史 東京大学, 情報基盤センター, 准教授 (40636049)
星野 哲也 名古屋大学, 情報基盤センター, 准教授 (40775946)
三木 洋平 東京大学, 情報基盤センター, 助教 (70734375)
伊田 明弘 国立研究開発法人海洋研究開発機構, 付加価値情報創生部門(地球情報科学技術センター), 主任研究員 (80742121)
|
Project Period (FY) |
2020-04-01 – 2023-03-31
|
Project Status |
Completed (Fiscal Year 2022)
|
Budget Amount *help |
¥45,110,000 (Direct Cost: ¥34,700,000、Indirect Cost: ¥10,410,000)
Fiscal Year 2022: ¥9,620,000 (Direct Cost: ¥7,400,000、Indirect Cost: ¥2,220,000)
Fiscal Year 2021: ¥19,760,000 (Direct Cost: ¥15,200,000、Indirect Cost: ¥4,560,000)
Fiscal Year 2020: ¥15,730,000 (Direct Cost: ¥12,100,000、Indirect Cost: ¥3,630,000)
|
Keywords | 高性能計算 / メニーコアプロセッサ / 余剰コア / OpenMP / MPI / GPU / 非同期IO / プロファイリング / メニーコア・マルチコアプロセッサ / 計算科学 / 並列処理 / 電力制御 |
Outline of Research at the Start |
近年のCPUの性能向上は,チップ内コア数の増加によって支えられているが,計算パターンによっては全コアを使うと却って性能を低下させる場合もあり,そのような場合には多くのコアを敢えて使わずに残すことになる。本研究提案では,そのような「余剰コア」に 対して,CPUで実行している主計算を支援する役割を与えることで,システム全体の性能改善や,電力制御,付加機能を低オーバヘッドで実現することを目的とし,ユーザレベルで支援機能を制御するためのフレームワーク "UTHelper"を開発する。さらに,実際のスーパーコンピュータ上でUTHelperを用いてアプリケーションに適用し,有効性を実証する。
|
Outline of Annual Research Achievements |
①余剰コアを用いたIn-situ解析として、銀河衝突シミュレーションにおける主計算(重力多体シミュレーションを用いた時間進化の計算)と副計算(数値的に得られた構造と実際に観測されている構造とを比較する解析処理)内の2つの処理を全てオーバラップする機能を実現した。OpenMPのtask指示文を用いることで、プログラムの構造を大きく変えずに、オーバラップ処理と同時に各実行領域で最適なコア割り当てを実現できることを示した。 ②分散メモリ計算環境向けにMPI+OpenMP並列化されたアプリケーションに対して、動的な負荷不均衡解消手法の開発を行った。2021年度までに、MPIプロセス毎のコア割当数を制御し、ノード内負荷不均衡を緩和する手法を提案した他、ノード間負荷不均衡の問題を量子アニーリングマシンを用いて解く試みを実施した。2022年度は、エネルギー削減を優先するポリシーについて実現した。さらにジョブ全体の性能を犠牲にすることなく、電力を削減する手法を提案した。 ③複数GPUによるステンシル計算では、GPU間の通信がアプリケーション性能低下につながる。本年度は、GPU計算中にCPUの余剰コアを用いてGPU間通信を行う通信隠蔽手法を引き続き検討した。計算領域の分割方法を変えながら、性能向上に対する通信隠蔽手法の有効性について検証を行った。 ④冗長な計算を必要とするOverlapped型のテンポラルブロッキングに加え、冗長な計算を必要としないtrapezoid型、及び両者のハイブリッドのテンポラルブロッキングを3次元の拡散方程式に実装し、最新のプロセッサにおいて評価を継続した。
|
Research Progress Status |
令和4年度が最終年度であるため、記入しない。
|
Strategy for Future Research Activity |
令和4年度が最終年度であるため、記入しない。
|
Report
(4 results)
Research Products
(33 results)