クラスタシステムにおける高信頼化技術の評価および設計法の検討
Project/Area Number |
02F00782
|
Research Category |
Grant-in-Aid for JSPS Fellows
|
Allocation Type | Single-year Grants |
Section | 外国 |
Research Field |
計算機科学
|
Research Institution | The University of Tokyo |
Principal Investigator |
南谷 崇 東京大学, 先端科学技術研究センター, 教授
|
Co-Investigator(Kenkyū-buntansha) |
GAO Wen 東京大学, 先端科学技術研究センター, 外国人特別研究員
|
Project Period (FY) |
2002 – 2004
|
Project Status |
Completed (Fiscal Year 2003)
|
Budget Amount *help |
¥1,300,000 (Direct Cost: ¥1,300,000)
Fiscal Year 2003: ¥900,000 (Direct Cost: ¥900,000)
Fiscal Year 2002: ¥400,000 (Direct Cost: ¥400,000)
|
Keywords | 耐故障性 / クラスタシステム / チェックポイント / リカバリー / シミュレーション |
Research Abstract |
サービスベースで再構成可能なグリッド環境向けの"耐故障クラスタシステム基盤"の実装および解析を行った。本システムは、必要とするサービスの抽象的な指定により、グリッド上のミッションクリティカルアプリケーションのためのクラスタ基盤を構築する。"アプリケーション用耐故障サービス(application high availability service)"が与えられたアプリケーションの耐故障性を保障する。サービスマネージャーは、ハートビートメカニズムにより全てのサービスを監視し、故障が生じた場合には自動的に復旧を行う。本システムでは、柔軟性と耐故障性を向上させるべく、動的再構成メカニズムがデザインしており、アプリケーションの実行を止めることなく再構成を行うことが可能である。再構成にあたっては、耐故障性のモデル、およびシミユレーションツールを適用する。この際に、対故障性に関するパラメータをパラメータとして入力することも可能である。本ツールにはオブジェクト、およびサブモデルライブラリが備わっており、対応する故障の大域モデルを構築することで、各種回復手法を用いた場合の統計情報などを得ることができる。クラスタ基盤は、この情報を基に再構築される。 一方、SCoreクラスタシステムソフトウェアは耐故障性のためにcoordinatedチェックポインティング、ロールバックリカバリー、およびwatch-dog timerを提供するクラスタソフトウェア環境である。SCoreにおけるチェックポインティングでは、ディスク性能が性能のボトルネックとなっていることがわかっている。そこで、ディスク書き込みのオーバヘッドを除去するため、ディスクレスチェックポインティングを提案した。提案するチェックポインティング方式では、パリティ計算、ディスク書き込みの必要なく、SCoreオリジナルのチェックポインティングに比べ高速であることが解析の結果わかった。また障害回復にかかる時間も小さいことがわかった。今後、チェックポインティングのためのメモリ消費量を抑えるための工夫や、複数ノード障害への対処法などを検討していく予定である。
|
Report
(2 results)
Research Products
(3 results)