• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2011 Fiscal Year Annual Research Report

アクセラレータスーパーコンピュータ向けスケーラブルかつ高速なチェックポイント技術

Research Project

Project/Area Number 22700047
Research InstitutionTokyo Institute of Technology

Principal Investigator

丸山 直也  東京工業大学, 学術国際情報センター, 助教 (60532801)

Keywords高性能計算 / 耐故障性 / スーパーコンピュータ / GPGPU
Research Abstract

本年度は並列GPUプログラムを高速かつ透過的にチエックポイントすることを目的にこれまで開発したチェックポイント技法をもとにした研究開発を行った。具体的には透過的なチェックポイントを実現するためにアプリケーションフレームワークを構成し、フレームワークによって透過的なチェックポイントを実現した。GPUプログラミングにおいて主流であるCUDAを用いたアプリケーションでは一般的には種々の技術的制約により透過性を達成することは不可能である。我々は透過的にチェックポイントが可能なアプリケーションフレームワークとして、ステンシル計算を対象としたドメイン特化型フレームワークを構築した。アプリケーションは同フレームワークのドメイン特化型言語を用いて機種独立に記述され、実際の実行コードはドメイン特化型言語から特定の機種向けソースコードを生成しそれを通常のプログラムとしてコンパイルすることで生成する。GPU向けにはCUDAコードを生成するが、チェックポイント可能なタイミングにおいて定期的に昨年度までに開発したCUDAチェックポイント技法を応用することでアプリケーションコンテキストをチェックポイントする。GPU向けシステムレベルチェックポイントではPinnedメモリなどの利用が必ずしもできないが、本フレームワークでは適切にリソースの破棄・復元を行うことで通常のCUDAアプリケーションと同様にPinnedメモリを使った非同期転送などの最適化を実現している。本年度は本フレームワークのプロトタイプとして、チェックポイントおよびリスタート機能の試験実装を行い、GPUクラスタ環境において適切に動作することを確認し、Pinnedメモリを用いることなどによる効率改善を確認した。

  • Research Products

    (5 results)

All 2012 2011

All Presentation (5 results)

  • [Presentation] Physis : An Implicitly Parallel Framework for stencil Computations2012

    • Author(s)
      Naoya Maruyama
    • Organizer
      Trends in High-Performance Distributed Computing
    • Place of Presentation
      Amsterdam, Netherland
    • Year and Date
      2012-03-14
  • [Presentation] Towards an Asynchronous Checkpointing System2011

    • Author(s)
      Kento Satou, Adam Moody, Kathryn Mohror, Todd Gamblin, Bronis R. De Supinski, Naoya Maruyama, Satoshi Matsuoka
    • Organizer
      IPSJ SIG Technical Reports 2011-ARC-197 2011-HPC-132 (HOKKE-19)
    • Place of Presentation
      札幌
    • Year and Date
      2011-11-28
  • [Presentation] FTI : High performance Fault Tolerance Interface for hybrid systems2011

    • Author(s)
      Leonardo Bautista, Naoya Maruyama, Dimitri Komatitsch, Tsuboiiji, Franck Cappello, Satoshi Matsuoka, Kakamura Takeshi
    • Organizer
      International Conference for High Performance Computing, Networking, Storage and Analysis (SC)
    • Place of Presentation
      Seattle, USA
    • Year and Date
      2011-11-16
  • [Presentation] Physis : An Implicitly Parallel Programming Model forStencil Computations on Large-Scale GPU-AcceleratedSupercomputers2011

    • Author(s)
      Naoya Maruyama, Tatsuo Nomura, Kento Sato, Satoshi Matsuoka
    • Organizer
      Supercomputing 2011
    • Place of Presentation
      Seattle, USA
    • Year and Date
      2011-11-15
  • [Presentation] Accelerating the TSUBAME Supercomputer with Graphics Processing Units and its Implications for Systems Research2011

    • Author(s)
      Naoya Maruyama
    • Organizer
      Workshop on Large-Scale Parallel Processing (LSPP'11) in conjunction with IEEE International Parallel and Distributed Processing Symposium (IPDPS' 11)
    • Place of Presentation
      Anchorage, USA
    • Year and Date
      2011-05-20

URL: 

Published: 2013-06-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi