• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

1億並列・エクサスケールスーパーコンピュータの耐故障性基盤

Research Project

Project/Area Number 23240006
Research Category

Grant-in-Aid for Scientific Research (A)

Allocation TypeSingle-year Grants
Section一般
Research Field Computer system/Network
Research InstitutionTokyo Institute of Technology

Principal Investigator

松岡 聡  東京工業大学, 学術国際情報センター, 教授 (20221583)

Project Period (FY) 2011
Project Status Completed (Fiscal Year 2011)
Budget Amount *help
¥13,000,000 (Direct Cost: ¥10,000,000、Indirect Cost: ¥3,000,000)
Fiscal Year 2011: ¥13,000,000 (Direct Cost: ¥10,000,000、Indirect Cost: ¥3,000,000)
Keywordsハイパフォーマンスコンピューティング / エクサスケール / ヘテロジニアスアーキテクチャ / 耐障害性 / チェックポイント・リスタート
Research Abstract

科学技術分野において、大規模なシミュレーションではスーパーコンピュータ(スパコン)の利用が不可欠となっている。しかし、スパコンに搭載される機器の増大・複雑化により、障害発生率が増加し、システムが実質的に動作しなくなると危惧されており、チェックポイント/リスタートなどの耐障害手法の適用が不可避となっているが、ポストペタースケールスパコンでは、技術的な課題が残る。このため、初年度は、1億スレッド・ポストペタのための基礎的な複合的なチェックポイント・リスタートを行うための耐故障性の数理モデル・性能モデルを探求し、特にポストペタスケールアプリケーションに適した耐障害手法の億単位のスレッド時の定量的性質を明らかにすることを目的として研究に従事した。実際、ポストペタ・エクサスケールスパコンの最有力アーキテクチャである細粒度長並列プロセッサ+粗粒度プロセッサを併用するハイブリッド型アーキテクチャにおいて、チェックポイント/リスタートは種々の技術的困難を伴う技術であったが、我々は、単一GPUにおける「リプレイ手法(メモリ割り当てやメモリーコピーの履歴を取り、リスタートの際に、その履歴に基づいて再現実行"リプレイ"を行うことにより、整合性の取れたチェックポイントを取る手法)」を拡張し、ノード内およびノード外の複数のCPU・GPUを使用するアプリケーションにおいて、安定かつ一貫性のとれたチェックポインティングを実現した。また、性能面においても、許容されるレベルのオーバーヘッドまでに押さえた。また、我々が開発したライブラリでは既存のプログラムに変更を加えることなく、これを実現することが可能であり、可用性にも優れている。超細粒度並列・ハイブリッド型アーキテクチャにおける透過的なチェックポイントの実現は、学術的インパクトも大きいと期待される。

Report

(1 results)
  • 2011 Annual Research Report
  • Research Products

    (13 results)

All 2011 Other

All Presentation (12 results) Remarks (1 results)

  • [Presentation] スーパーコンピュータTSUBAME 2.0におけるLinpack性能1ペタフロップス超の達成2011

    • Author(s)
      遠藤敏夫
    • Organizer
      先進的計算基盤システムシンポジウムSACSIS2011
    • Place of Presentation
      秋葉原
    • Year and Date
      2011-05-27
    • Related Report
      2011 Annual Research Report
  • [Presentation] Dealing with Grid-Computing Authorization using Identity-Based Certificateless Proxy Signature2011

    • Author(s)
      Mohamed Amin
    • Organizer
      IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid 2011)
    • Place of Presentation
      Newport Beach, USA
    • Year and Date
      2011-05-26
    • Related Report
      2011 Annual Research Report
  • [Presentation] ワークフローアプリケーションに対する計算資源割り当ての最適化2011

    • Author(s)
      斎藤貴文
    • Organizer
      先進的計算基盤システムシンポジウムSACSIS2011
    • Place of Presentation
      秋葉原(ポスター発表)
    • Year and Date
      2011-05-26
    • Related Report
      2011 Annual Research Report
  • [Presentation] GPUを考慮したMapReduceのアクセラレーション2011

    • Author(s)
      白幡晃一
    • Organizer
      先進的計算基盤システムシンポジウムSACSIS2011
    • Place of Presentation
      秋葉原(ポスター発表)
    • Year and Date
      2011-05-26
    • Related Report
      2011 Annual Research Report
  • [Presentation] CPU/GPUヘテロジニアス環境におけるFMMの最適化2011

    • Author(s)
      福田圭祐
    • Organizer
      先進的計算基盤システムシンポジウムSACSIS2011
    • Place of Presentation
      秋葉原(ポスター発表)
    • Year and Date
      2011-05-26
    • Related Report
      2011 Annual Research Report
  • [Presentation] From Utility Computing to Computing for Utilities : Using Cloud Computing to Accelerate Energy Informatics2011

    • Author(s)
      Satoshi Matsuoka
    • Organizer
      The 11th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (CCGrid2011)
    • Place of Presentation
      Newport Beach USA(Invited Panelist)
    • Year and Date
      2011-05-25
    • Related Report
      2011 Annual Research Report
  • [Presentation] 25th Year Panel : LOOKING BACK2011

    • Author(s)
      Satoshi Matsuoka
    • Organizer
      The 25th IEEE International Parallel & Distributed Processing Symposium (IPDPS 2011)
    • Place of Presentation
      Anchorage, USA(Invited Panelist)
    • Year and Date
      2011-05-17
    • Related Report
      2011 Annual Research Report
  • [Presentation] NVCR : A Transparent Checkpoint-Restart Library for NVIDIA CUDA2011

    • Author(s)
      Akira Nukada
    • Organizer
      The 20th International Heterogeneity in Computing Workshop (HCW 2011), in conjunction with IEEE IPDPS 2011
    • Place of Presentation
      Anchorage, USA
    • Year and Date
      2011-05-16
    • Related Report
      2011 Annual Research Report
  • [Presentation] TSUBAME2.0, or the long road from tiny clusters to Petascale2011

    • Author(s)
      Satoshi Matsuoka
    • Organizer
      ComplexHPC Spring School 2011
    • Place of Presentation
      Amsterdam, The Netherlands(Keynote talk)
    • Year and Date
      2011-05-10
    • Related Report
      2011 Annual Research Report
  • [Presentation] TSUBAME2.0…Environmentally Friendly Petascale Computing and its Possible Contributions to High-Resolution Natural Disaster Simulations2011

    • Author(s)
      Satoshi Matsuoka
    • Organizer
      The fourth International Manycore and Reconfigurable Supercomputing Conference (MRSC)
    • Place of Presentation
      Bristol, UK(Keynote talk)
    • Year and Date
      2011-04-12
    • Related Report
      2011 Annual Research Report
  • [Presentation] Update on Japanese HPC : Expected funding and plans beyond NGS2011

    • Author(s)
      Satoshi Matsuoka
    • Organizer
      International Exascale Software Project (IESP) Meeting 6
    • Place of Presentation
      Newport Beach, USA(Invited Presentation)
    • Year and Date
      2011-04-06
    • Related Report
      2011 Annual Research Report
  • [Presentation] 世界一グリーンな実運用スパコンの東工大TSUBAME2.02011

    • Author(s)
      松岡聡
    • Organizer
      蔵前兵庫県支部総会
    • Place of Presentation
      神戸市(招待講演)
    • Year and Date
      2011-04-02
    • Related Report
      2011 Annual Research Report
  • [Remarks]

    • URL

      http://matsu-www.is.titech.ac.jp/

    • Related Report
      2011 Annual Research Report

URL: 

Published: 2011-04-06   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi