研究概要 |
本研究の目標は,従来その利便性のみが議論されてきた巡回型計算を対象に,分散システムとしての全域チェックポイント取得問題を取り上げ,取得アルゴリズムを示すとともに実システム上での評価実験を通してその有効性を実証的に検証することにある.研究初年度である平成14年度は,下記に示す2つの準備的な研究を並行して行った. 1.提案手法の有用性を検証する実証実験プラットフォームとして,環境適応型移動オブジェクト・モデルに基づく巡回計算支援ミドルウェアm-P@gentを構築した.同ミドルウェアは,PDAや情報家電機器等の限定された計算資源しか持たない機器上でも動作し,本課題の実験プラットフォームとして有用である.同プラットフォーム上に,RgSSをベースに補償オペレーション(compensation operation)の概念を導入した新たな移動プロセス個々のロールバック機構を設計した.補償オペレーションによるロールバック機構は,短期のトランザクションのロールバックにおいて高効率であることが知られている.長期のトランザクションに適したチェックポイントベースのロールバック機構と組み合わせることにより,障害発生時のプロセス個々のリカバリを高効率かつ柔軟に行うことが可能になると予想される. 2.問題を簡略化し,「移動プロセスの数を限定した小規模システムでの一貫性ある全域チェックポイントの取得」とした場合の,全域チェックポイント取得アルゴリズムをRgSSをベースに設計した.本設計では,滝沢氏らによるhybrid checkpointing protocol(以下,HCP)で導入された移動支援ホスト(移動ホストのチェックポインティングを支援するホスト)の概念をRgSSに適用することにより,アルゴリズムの簡略化を行った.具体的には,HCPの移動支援ホストモデルを,固定の計算資源を持たない移動プロセスをも対象とするように拡張するとともに,アルゴリズムの開発,実装のための詳細化を行った.
|