研究概要 |
本研究の目標は,従来その利便性のみが議論されてきた巡回型計算を対象に,分散システムとしての全域チェックポイント取得問題を取り上げ,取得アルゴリズムを示すとともにその有効性を実証的に検証することにある.平成12年度は,次の2つの準備的な研究を並行して進めた. 1.巡回計算支援ミドルウェア上への実装の準備として,小規模な実験環境を整備し,Norwegian Army Protocol(以下,NAP)をベースに移動プロセス個々のチェックポインティング・ロールパック機構を設計,実装した.NAPでは,移動プロセスのロールバックを行うバックアップ・プロセスの概念が導入されており,同モデルをベースとすることにより,ホストの故障と移動プロセスの故障の両障害に対応可能となった. 2.問題を簡略化し,「移動プロセス1つを含むシステムでの一貫性のある全域チェックポイントを求める」とした場合の,全域チェックポイント取得アルゴリズムを,Hybrid Checkpointing Protocol(以下,HCP)をベースに構築した.HCPは,効率の良いアルゴリズムであることが知られており,同モデルで導入された移動支援ホスト(移動ホストのチェックポインティングを支援するホスト)の概念を本研究にも適用することにより,アルゴリズムを簡略化することが可能となる.本研究課題では,固定の計算資源を持たない移動プロセスも対象とするように移動支援ホストモデルを拡張するとともに,アルゴリズムの開発,実装のための詳細化を行った.その詳細化の過程で,移動プロセスを全域チェックポインティングの対象に含めるためのシステム側の条件,移動プロセスが備えるべき要件の詳細を明らかにすることができた. 補足 実験環境としては現有のIBM PC/AT互換機1台,可搬型計算機に加え,本設備備品費より新規に1台を実験用計算機として購入(平成12年8月),計3台程度の計算機をEthernetならびに同じく本設備備品費より購入した無線ネットワーク設備(同時期に導入)で接続した環境を構築した.巡回計算支援ミドルウェアとしては,申請者が開発したシステムを用いた.
|