• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2023 年度 研究成果報告書

GPUアプリケーションに対するシステムレベルのチェックポイント技術の確立

研究課題

  • PDF
研究課題/領域番号 20K19807
研究種目

若手研究

配分区分基金
審査区分 小区分60090:高性能計算関連
研究機関筑波大学

研究代表者

額田 彰  筑波大学, 計算科学研究センター, 教授 (40545688)

研究期間 (年度) 2020-04-01 – 2024-03-31
キーワードGPUコンピューティング / チェックポイント / CUDA
研究成果の概要

計算実行中の障害や実行時間制限のある共用システムで長時間要する計算を行うときには実行状態を保存するチェックポイント技術が有効である。ユーザのプログラムを修正する必要がないシステムレベルチェックポイントではCPUのメモリのイメージを保存する仕組みでありGPUアプリケーションに対応していない。GPUのランタイムライブラリを置き換えることによってGPU側の状態をCPUメモリに保存し、また再開時にはそのデータからGPU側の状態を再構築する技術を確立した。再構築するためにはGPUにアクセスするプロセスを分離することが必須で、ライブラリ関数の呼び出しをプロセス間でリレーする方式を採用した。

自由記述の分野

GPUコンピューティング

研究成果の学術的意義や社会的意義

現在GPUコンピューティングで主流となっているNVIDIA社のGPUに関して、CUDAで開発されたアプリケーションの実行バイナリを改変することなくチェックポイントに対応するソフトウェアの確立に成功した。プロセスを分離する方式を採用していることによってライブラリ関数の呼び出しやCPUとGPU間のデータ転送にオーバヘッドが生じる。主要な関数や実アプリケーションについてオーバヘッドの評価を行ったところ、GPUが十分に活用されているような状況ではオーバヘッドが非常に小さいことを確認している。

URL: 

公開日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi