• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

1億並列・エクサスケールスーパーコンピュータの耐故障性基盤

研究課題

研究課題/領域番号 23240006
研究種目

基盤研究(A)

配分区分補助金
応募区分一般
研究分野 計算機システム・ネットワーク
研究機関東京工業大学

研究代表者

松岡 聡  東京工業大学, 学術国際情報センター, 教授 (20221583)

研究期間 (年度) 2011
研究課題ステータス 完了 (2011年度)
配分額 *注記
13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
2011年度: 13,000千円 (直接経費: 10,000千円、間接経費: 3,000千円)
キーワードハイパフォーマンスコンピューティング / エクサスケール / ヘテロジニアスアーキテクチャ / 耐障害性 / チェックポイント・リスタート
研究概要

科学技術分野において、大規模なシミュレーションではスーパーコンピュータ(スパコン)の利用が不可欠となっている。しかし、スパコンに搭載される機器の増大・複雑化により、障害発生率が増加し、システムが実質的に動作しなくなると危惧されており、チェックポイント/リスタートなどの耐障害手法の適用が不可避となっているが、ポストペタースケールスパコンでは、技術的な課題が残る。このため、初年度は、1億スレッド・ポストペタのための基礎的な複合的なチェックポイント・リスタートを行うための耐故障性の数理モデル・性能モデルを探求し、特にポストペタスケールアプリケーションに適した耐障害手法の億単位のスレッド時の定量的性質を明らかにすることを目的として研究に従事した。実際、ポストペタ・エクサスケールスパコンの最有力アーキテクチャである細粒度長並列プロセッサ+粗粒度プロセッサを併用するハイブリッド型アーキテクチャにおいて、チェックポイント/リスタートは種々の技術的困難を伴う技術であったが、我々は、単一GPUにおける「リプレイ手法(メモリ割り当てやメモリーコピーの履歴を取り、リスタートの際に、その履歴に基づいて再現実行"リプレイ"を行うことにより、整合性の取れたチェックポイントを取る手法)」を拡張し、ノード内およびノード外の複数のCPU・GPUを使用するアプリケーションにおいて、安定かつ一貫性のとれたチェックポインティングを実現した。また、性能面においても、許容されるレベルのオーバーヘッドまでに押さえた。また、我々が開発したライブラリでは既存のプログラムに変更を加えることなく、これを実現することが可能であり、可用性にも優れている。超細粒度並列・ハイブリッド型アーキテクチャにおける透過的なチェックポイントの実現は、学術的インパクトも大きいと期待される。

報告書

(1件)
  • 2011 実績報告書
  • 研究成果

    (13件)

すべて 2011 その他

すべて 学会発表 (12件) 備考 (1件)

  • [学会発表] スーパーコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成2011

    • 著者名/発表者名
      遠藤敏夫
    • 学会等名
      先進的計算基盤システムシンポジウムSACSIS2011
    • 発表場所
      秋葉原
    • 年月日
      2011-05-27
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Dealing with Grid-Computing Authorization using Identity-Based Certificateless Proxy Signature2011

    • 著者名/発表者名
      Mohamed Amin
    • 学会等名
      IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2011)
    • 発表場所
      Newport Beach, USA
    • 年月日
      2011-05-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] ワークフローアプリケーションに対する計算資源割り当ての最適化2011

    • 著者名/発表者名
      斎藤貴文
    • 学会等名
      先進的計算基盤システムシンポジウムSACSIS2011
    • 発表場所
      秋葉原(ポスター発表)
    • 年月日
      2011-05-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] GPUを考慮したMapReduceのアクセラレーション2011

    • 著者名/発表者名
      白幡晃一
    • 学会等名
      先進的計算基盤システムシンポジウムSACSIS2011
    • 発表場所
      秋葉原(ポスター発表)
    • 年月日
      2011-05-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] CPU/GPUヘテロジニアス環境におけるFMMの最適化2011

    • 著者名/発表者名
      福田圭祐
    • 学会等名
      先進的計算基盤システムシンポジウムSACSIS2011
    • 発表場所
      秋葉原(ポスター発表)
    • 年月日
      2011-05-26
    • 関連する報告書
      2011 実績報告書
  • [学会発表] From Utility Computing to Computing for Utilities : Using Cloud Computing to Accelerate Energy Informatics2011

    • 著者名/発表者名
      Satoshi Matsuoka
    • 学会等名
      The 11th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid2011)
    • 発表場所
      Newport Beach USA(Invited Panelist)
    • 年月日
      2011-05-25
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 25th Year Panel : LOOKING BACK2011

    • 著者名/発表者名
      Satoshi Matsuoka
    • 学会等名
      The 25th IEEE International Parallel & Distributed Processing Symposium (IPDPS 2011)
    • 発表場所
      Anchorage, USA(Invited Panelist)
    • 年月日
      2011-05-17
    • 関連する報告書
      2011 実績報告書
  • [学会発表] NVCR : A Transparent Checkpoint-Restart Library for NVIDIA CUDA2011

    • 著者名/発表者名
      Akira Nukada
    • 学会等名
      The 20th International Heterogeneity in Computing Workshop (HCW 2011), in conjunction with IEEE IPDPS 2011
    • 発表場所
      Anchorage, USA
    • 年月日
      2011-05-16
    • 関連する報告書
      2011 実績報告書
  • [学会発表] TSUBAME2.0, or the long road from tiny clusters to Petascale2011

    • 著者名/発表者名
      Satoshi Matsuoka
    • 学会等名
      ComplexHPC Spring School 2011
    • 発表場所
      Amsterdam, The Netherlands(Keynote talk)
    • 年月日
      2011-05-10
    • 関連する報告書
      2011 実績報告書
  • [学会発表] TSUBAME2.0…Environmentally Friendly Petascale Computing and its Possible Contributions to High-Resolution Natural Disaster Simulations2011

    • 著者名/発表者名
      Satoshi Matsuoka
    • 学会等名
      The fourth International Manycore and Reconfigurable Supercomputing Conference (MRSC)
    • 発表場所
      Bristol, UK(Keynote talk)
    • 年月日
      2011-04-12
    • 関連する報告書
      2011 実績報告書
  • [学会発表] Update on Japanese HPC : Expected funding and plans beyond NGS2011

    • 著者名/発表者名
      Satoshi Matsuoka
    • 学会等名
      International Exascale Software Project (IESP) Meeting 6
    • 発表場所
      Newport Beach, USA(Invited Presentation)
    • 年月日
      2011-04-06
    • 関連する報告書
      2011 実績報告書
  • [学会発表] 世界一グリーンな実運用スパコンの東工大TSUBAME2.02011

    • 著者名/発表者名
      松岡聡
    • 学会等名
      蔵前兵庫県支部総会
    • 発表場所
      神戸市(招待講演)
    • 年月日
      2011-04-02
    • 関連する報告書
      2011 実績報告書
  • [備考]

    • URL

      http://matsu-www.is.titech.ac.jp/

    • 関連する報告書
      2011 実績報告書

URL: 

公開日: 2011-04-06   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi