• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2004 Fiscal Year Annual Research Report

空間冗長度の時間畳み込みによるクラスタシステムの高信頼化

Research Project

Project/Area Number 16650008
Research InstitutionThe University of Tokyo

Principal Investigator

中村 宏  東京大学, 先端科学技術研究センター, 助教授 (20212102)

Co-Investigator(Kenkyū-buntansha) 南谷 崇  東京大学, 先端科学技術研究センター, 教授 (80143684)
Keywordsクラスタシステム / 高信頼化 / チェックポインティング / 空間的冗長度 / 時間的冗長度 / マルコフモデル
Research Abstract

本研究の目的は、汎用の高性能な計算ノードを多数高速ネットワークで接続するクラスタシステムの高信頼化であり、クラスタシステムの状態を最低限の空間冗長度で保持し、それを時間軸上で畳み込むことでさらに高い冗長度を確保する新しい手法として、skewed checkpointihgという新しいチェックポイント方式を提案した。本年度は、その有効性と限界を理論的に検証した。まず、空間冗長度1の状態保存を畳み込むことで実現できる論理的冗長度とノード数との関係を明らかにした。ノード数がNで与えられた時、実現可能な論理的冗長度mはm=〓log_2N」で与えられることを示した。次に、その時の空間冗長ベクトルの畳み込み方式が高速フーリエ変換でよく見られるバタフライ演算と同じで良い事を示した。さらに、この畳み込み方式を用いた場合に、任意のm重故障からクラスタシステムが復帰できること、つまり、任意の時点で常に論理的冗長度mが確保されていることの証明を示した。その後、達成すべき論理的冗長度が与えられた時の、この空間冗長ベクトル畳み込みを用いた状態保存のアルゴリズムと、障害発生時の状態復元のアルゴリズムの基本設計を行い、さらに開発したアルゴリズムを、設備備品で購入予定の小規模なクラスタシステム上に概念実装することで、アルゴリズムの正しさを確認した。最後に、提案手法の有効性を検証するための理論解析として、障害発生と障害からの復旧を確率事象とみなすマルコフモデルを構築し、その解析に着手した。

  • Research Products

    (3 results)

All 2004

All Journal Article (3 results)

  • [Journal Article] 多重故障に適応したSkewed Checkpointingの提案2004

    • Author(s)
      田島裕也, 林田卓朗, 近藤正章, 今井雅, 中村宏, 南谷崇
    • Journal Title

      先進的計算基盤システムシンポジウムSACSIC2004

      Pages: 153-154

  • [Journal Article] Skewed Checkpointing for Tolerating Multi-Node Failures2004

    • Author(s)
      H.Nakamura, T.Hayashida, M.Kondo, Y.Tajima, M.Imai, T.Nanya
    • Journal Title

      Proceedings of IEEE SRDS '04

      Pages: 116-125

  • [Journal Article] 多重故障を考慮した計算機クラスタ向けSkewed Checkpointingの検討2004

    • Author(s)
      田島裕也, 林田卓朗, 近藤正章, 今井雅, 中村宏, 南谷崇
    • Journal Title

      信学技報 DC2004-19(2004-07)

      Pages: 37-42

URL: 

Published: 2006-07-12   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi