2022 Fiscal Year Research-status Report
GPUアプリケーションに対するシステムレベルのチェックポイント技術の確立
Project/Area Number |
20K19807
|
Research Institution | University of Tsukuba |
Principal Investigator |
額田 彰 筑波大学, 計算科学研究センター, 教授 (40545688)
|
Project Period (FY) |
2020-04-01 – 2024-03-31
|
Keywords | GPU / チェックポイント |
Outline of Annual Research Achievements |
GPUアプリケーションを対象とするシステムレベルチェックポイントの実現という研究課題でこれまでNVIDIAのGPUとCUDA C/C++というプログラミング手法を対象としてきた。アプリケーションのバイナリーをそのまま使い、動的リンクされるライブラリ側をチェックポイント機能を追加したものに入れ替えることによって透過的なチェックポイントを実現している。本手法はOpenCLやAMDのHIPのような同等のAPIを用いるアプリケーションについても適用可能であると考えられる。一方でOpenACC、OpenMPなどのディレクティブ挿入によるGPUプログラミングが主流となってきている。これらのアプリケーションバイナリーに対してチェックポイント機能を組み込んだランタイムライブラリを実装することは理論的には可能であるが、CUDA APIのように公開されたAPIではないため解析に時間がかかり事実上不可能である。またこれらのプログラミング手法ではより容易になるUnified memoryの使用が推奨されている。このUnified memoryはホスト側でもデバイス側でも有効なアドレスを持ち、これがリスタート時にGPU側のアドレス空間を再現するということを難しくする。
|
Current Status of Research Progress |
Current Status of Research Progress
3: Progress in research has been slightly delayed.
Reason
本研究で導入した機器の修理がコロナ禍の工場封鎖や不安定な物流などの影響を受けて時間がかかっている。管理者権限が必要な評価はこれまで古い世代のGPUを搭載するシステムで行ってきたが、機材が戻ってき次第評価を行う。
|
Strategy for Future Research Activity |
令和5年度は最終年度として、これまで研究してきた各種技術を最新のハードウェア及びソフトウェア環境で評価を行い、互換性等に問題ないかの確認を行う。またそれらを拡張することによって可能となる関連技術についての検討を行う予定である。
|
Causes of Carryover |
コロナ禍の影響で実験用計算機の導入が難しくなっている。次年度では最終年度として成果発表の旅費や論文投稿料に主としてあて、最新GPUの利用料にも一部あてる予定である。
|