研究課題/領域番号 |
16650008
|
研究機関 | 東京大学 |
研究代表者 |
中村 宏 東京大学, 先端科学技術研究センター, 助教授 (20212102)
|
研究分担者 |
南谷 崇 東京大学, 先端科学技術研究センター, 教授 (80143684)
|
キーワード | クラスタシステム / 高信頼化 / チェックポインティング / 空間的冗長度 / 時間的冗長度 / マルコフモデル |
研究概要 |
本研究の目的は、汎用の高性能な計算ノードを多数高速ネットワークで接続するクラスタシステムの高信頼化であり、クラスタシステムの状態を最低限の空間冗長度で保持し、それを時間軸上で畳み込むことでさらに高い冗長度を確保する新しい手法として、skewed checkpointihgという新しいチェックポイント方式を提案した。本年度は、その有効性と限界を理論的に検証した。まず、空間冗長度1の状態保存を畳み込むことで実現できる論理的冗長度とノード数との関係を明らかにした。ノード数がNで与えられた時、実現可能な論理的冗長度mはm=〓log_2N」で与えられることを示した。次に、その時の空間冗長ベクトルの畳み込み方式が高速フーリエ変換でよく見られるバタフライ演算と同じで良い事を示した。さらに、この畳み込み方式を用いた場合に、任意のm重故障からクラスタシステムが復帰できること、つまり、任意の時点で常に論理的冗長度mが確保されていることの証明を示した。その後、達成すべき論理的冗長度が与えられた時の、この空間冗長ベクトル畳み込みを用いた状態保存のアルゴリズムと、障害発生時の状態復元のアルゴリズムの基本設計を行い、さらに開発したアルゴリズムを、設備備品で購入予定の小規模なクラスタシステム上に概念実装することで、アルゴリズムの正しさを確認した。最後に、提案手法の有効性を検証するための理論解析として、障害発生と障害からの復旧を確率事象とみなすマルコフモデルを構築し、その解析に着手した。
|