研究課題/領域番号 |
12558025
|
研究機関 | 東京工業大学 |
研究代表者 |
松岡 聡 東京工業大学, 大学院・情報理工学研究科, 助教授 (20221583)
|
研究分担者 |
石川 裕 技術研究組合, 新情報処理開発機構, 室長
小川 宏高 東京工業大学, 大学院・情報理工学研究科, 助手 (90302968)
合田 憲人 東京工業大学, 大学院・総合理工学研究科, 講師 (80247212)
高木 浩光 電子技術総合研究所, 情報アーキテクチャ部, 主任研究官
|
キーワード | PCクラスタ / Plug-and-Play / MPI / チェックポイント / マイグレーション / 耐故障性 / 並列処理 / クラスタ評価環境 |
研究概要 |
本年度は、Plug-and-Playクラスタのテストベッドを構築し、その上にPlug&Play性の基本技術となる分散チェックポイントとマイグレーションを行うMPIシステムのアルゴリズムとアーキテクチャを提案し、そのプロトタイプ実装を行った。テストベッドはノートブック型PCを要素要素とするPCクラスタであり、(DELL Inspiron 3800/Inspiron 4000計20台Mobile Celeron 600MHz,128MB Memory,20GB HDD,3COM Plug&Play PCMCIA 100Base-T Network Card),各要素ノードの着脱が容易に行え、かつクラスタ全体が完全にネットワーク、電源などからdetached operationが可能になっている。そのテストベッド上に、チェックポインティングをユーザーレベルで実装し、MPIの標準実装であるMPICHにチェックポインティング及びマイグレーションの機能を付加することにより、ユーザ透過にチェックポインティング・マイグレーション可能なMPICHの実装を行った。従来のチェックポインティング・マイグレーションを提供する多くの並列システムは、ユーザにチェックポインティング・マイグレーションの指示を要求したり、あるいはコンシステンシチェックポイントの実装部分を要求したりして、実際の使用は困難であったが、本システムはMPI通信ライブラリと一体化してコンシステントチェックポイントを分散システム上で自動検出し、ユーザの負担を減らす。また、アプリケーションによって適切なチェックポイントアルゴリズムは異なるが、本システムでは異なるアルゴリズムを選択可能にし、パラメタチューニング可能にすることによって、ユーザが最適なチェックポイントの戦略をとることを可能にしている。実装はまだ未完成であるが、稼動している部分ではオーバーヘッドは十分少なく、Plug-and-Playクラスタリングの礎として十分な性能であることが確認できた。
|