• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2011 年度 研究成果報告書

アクセラレータスーパーコンピュータ向けスケーラブルかつ高速なチェックポイント技術

研究課題

  • PDF
研究課題/領域番号 22700047
研究種目

若手研究(B)

配分区分補助金
研究分野 計算機システム・ネットワーク
研究機関東京工業大学

研究代表者

丸山 直也  東京工業大学, 学術国際情報センター, 助教 (60532801)

研究期間 (年度) 2010 – 2011
キーワード計算機システム / 高性能計算 / 耐故障性 / GPU計算
研究概要

本研究課題ではスーパーコンピュータなどの大規模並列計算環境においてアプリケーションを長時間実行可能にするためのソフトウェア技術を開発した。大規模なスーパーコンピュータではハードウェア等の故障による障害の発生は避けられず、システムが部分的に利用不可になる場合がある。我々はその問題に対してアプリケーション実行中に途中の状態を高速に保存し、障害が発生した場合に保存した状態から高速に復帰するためのアルゴリズムおよびその実装を行い、実際の大規模アクセラレータスーパーコンピュータ環境において実証した。

  • 研究成果

    (14件)

すべて 2011 2010

すべて 雑誌論文 (1件) (うち査読あり 1件) 学会発表 (12件) 図書 (1件)

  • [雑誌論文] Model-based Fault Localization : Finding Behavioral Outliers in Large-scale Computing Systems2010

    • 著者名/発表者名
      Naoya Maruyama and Satoshi Matsuoka
    • 雑誌名

      New Generation Computing

      巻: Vol28, No.3 ページ: 237-255

    • 査読あり
  • [学会発表] Towards an Asynchronous Check pointing System2011

    • 著者名/発表者名
      Kento Satou, Adam Moody, Kathryn Mohror, Todd Gamblin, Bronis R. De Supinski, Naoya Maruyama, Satoshi Matsuoka
    • 学会等名
      IPSJ SIG Technical Reports 2011-ARC-197 2011-HPC-132(HOKKE-19)
    • 発表場所
      Sapporo
    • 年月日
      2011-11-28
  • [学会発表] FTI : High performance Fault Tolerance Interface for hybrid systems2011

    • 著者名/発表者名
      Leonardo Bautista, Naoya Maruyama, Dimitri Komatitsch, Tsuboi Seiji, Franck Cappello, Satoshi Matsuoka, and Nakamura Takeshi
    • 学会等名
      ACM/IEEE Supercomputing(SC' 11)
    • 発表場所
      Seattle, USA
    • 年月日
      2011-11-16
  • [学会発表] Physis : An Implicitly Parallel Programming Model for Stencil Computations on Large-Scale GPU-Accelerated Supercomputers2011

    • 著者名/発表者名
      Naoya Maruyama, Tatsuo Nomura, Kento Sato, and Satoshi Matsuoka
    • 学会等名
      ACM/IEEE Supercomputing(SC' 11)
    • 発表場所
      Seattle, USA
    • 年月日
      2011-11-15
  • [学会発表] Accelerating the TSUBAME Supercomputer with Graphics Processing Units and its Implications for Systems Research2011

    • 著者名/発表者名
      Naoya Maruyama
    • 学会等名
      Workshop on Large-Scale Parallel Processing(LSPP' 11) in conjunction with IEEE International Parallel and Distributed Processing Symposium(IPDPS' 11)
    • 発表場所
      Anchorage, USA
    • 年月日
      2011-05-20
  • [学会発表] A Sequential Programming Framework for Large-Scale GPU-Accelerated Structured Grids2011

    • 著者名/発表者名
      Tatsuo Nomura, Naoya Maruyama, Toshio Endo, Satoshi Matsuoka
    • 学会等名
      SIAM Conference on Computational Science and Enginnering
    • 発表場所
      Reno, USA
    • 年月日
      2011-03-03
  • [学会発表] Low-overhead checkpoint for large-scale GPU-accelerated systems2010

    • 著者名/発表者名
      Leonardo Bautista, Akira Nukada, Naoya Maruyama, Franck Cappello, Satoshi Matsuoka
    • 学会等名
      High Performance Computing Conference(HiPC)
    • 発表場所
      Goa, India
    • 年月日
      2010-12-20
  • [学会発表] An 80-Fold Speedup, 15. 0 TFlops, Full GPU Acceleration of Non-Hydrostatic Weather Model ASUCA Production Code2010

    • 著者名/発表者名
      Takashi Shimokawabe, Takayuki Aoki, Chiashi Muroi, Junichi Ishida, Kohei Kawano, Toshio Endo, Akira Nukada, Naoya Maruyama, Satoshi Matsuoka
    • 学会等名
      ACM/IEEE Supercomputing(SC' 10)
    • 発表場所
      New Orleans, USA
    • 年月日
      2010-11-16
  • [学会発表] MPI-CUDA Applications Check pointing2010

    • 著者名/発表者名
      Toan Nguyen, Hideyuki Jitsumoto, Naoya Maruyama, Tatsuo Nomura, Toshio Endo, Satoshi Matsuoka
    • 学会等名
      並列/分散/協調処理に関するサマー・ワークショップ
    • 発表場所
      金沢
    • 年月日
      2010-08-04
  • [学会発表] GPUクラスタを対象にした並列ステンシル計算の自動コード生成フレームワーク2010

    • 著者名/発表者名
      野村達雄,丸山直也,遠藤敏夫,松岡聡
    • 学会等名
      並列/分散/協調処理に関するサマー・ワークショップ
    • 発表場所
      金沢
    • 年月日
      2010-08-03
  • [学会発表] Distributed Diskless Checkpoint for Large Scale Systems2010

    • 著者名/発表者名
      Leonardo Bautista, Naoya Maruyama, Franck Cappello, Satoshi Matsuoka
    • 学会等名
      IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing(CCGrid' 10)
    • 発表場所
      Melbourne, Australia
    • 年月日
      2010-05-18
  • [学会発表] Linpack Evaluation on a Supercomputer with Heterogeneous Accelerators2010

    • 著者名/発表者名
      Toshio Endo, Akira Nukada, Satoshi Matsuoka, and Naoya Maruyama
    • 学会等名
      IEEE International Parallel & Distributed Processing Symposium(IPDPS2010)
    • 発表場所
      Atlanta, USA
    • 年月日
      2010-04-21
  • [学会発表] A High-Performance Fault-Tolerant Software Framework for Memory on Commodity GPUs2010

    • 著者名/発表者名
      Naoya Maruyama, Akira Nukada, and Satoshi Matsuoka
    • 学会等名
      IEEE International Parallel & Distributed Processing Symposium(IPDPS2010)
    • 発表場所
      Atlanta, USA
    • 年月日
      2010-04-20
  • [図書] アスキー・メディアワークス2010

    • 著者名/発表者名
      松岡聡,青木尊之,遠藤敏夫,丸山直也,佐藤仁,滝澤真一朗,實本英之
    • 総ページ数
      48
    • 出版者
      TSUBAMEの造り方から探るPCクラスターと『スパコン』のあいだ

URL: 

公開日: 2013-07-31  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi