2000 Fiscal Year Annual Research Report
Plug&Play並列クラスタ計算機による動的再構成可能で広範な並列処理の実現
Project/Area Number |
12558025
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
松岡 聡 東京工業大学, 大学院・情報理工学研究科, 助教授 (20221583)
|
Co-Investigator(Kenkyū-buntansha) |
石川 裕 技術研究組合, 新情報処理開発機構, 室長
小川 宏高 東京工業大学, 大学院・情報理工学研究科, 助手 (90302968)
合田 憲人 東京工業大学, 大学院・総合理工学研究科, 講師 (80247212)
高木 浩光 電子技術総合研究所, 情報アーキテクチャ部, 主任研究官
|
Keywords | PCクラスタ / Plug-and-Play / MPI / チェックポイント / マイグレーション / 耐故障性 / 並列処理 / クラスタ評価環境 |
Research Abstract |
本年度は、Plug-and-Playクラスタのテストベッドを構築し、その上にPlug&Play性の基本技術となる分散チェックポイントとマイグレーションを行うMPIシステムのアルゴリズムとアーキテクチャを提案し、そのプロトタイプ実装を行った。テストベッドはノートブック型PCを要素要素とするPCクラスタであり、(DELL Inspiron 3800/Inspiron 4000計20台Mobile Celeron 600MHz,128MB Memory,20GB HDD,3COM Plug&Play PCMCIA 100Base-T Network Card),各要素ノードの着脱が容易に行え、かつクラスタ全体が完全にネットワーク、電源などからdetached operationが可能になっている。そのテストベッド上に、チェックポインティングをユーザーレベルで実装し、MPIの標準実装であるMPICHにチェックポインティング及びマイグレーションの機能を付加することにより、ユーザ透過にチェックポインティング・マイグレーション可能なMPICHの実装を行った。従来のチェックポインティング・マイグレーションを提供する多くの並列システムは、ユーザにチェックポインティング・マイグレーションの指示を要求したり、あるいはコンシステンシチェックポイントの実装部分を要求したりして、実際の使用は困難であったが、本システムはMPI通信ライブラリと一体化してコンシステントチェックポイントを分散システム上で自動検出し、ユーザの負担を減らす。また、アプリケーションによって適切なチェックポイントアルゴリズムは異なるが、本システムでは異なるアルゴリズムを選択可能にし、パラメタチューニング可能にすることによって、ユーザが最適なチェックポイントの戦略をとることを可能にしている。実装はまだ未完成であるが、稼動している部分ではオーバーヘッドは十分少なく、Plug-and-Playクラスタリングの礎として十分な性能であることが確認できた。
|
Research Products
(6 results)
-
[Publications] 松岡聡: "MPC++-on-MPIのコモディティクラスタ環境における評価"情報処理学会論文誌:ハイパフォーマンスコンピューティングシステム. 41-8(HPS2). 60-72 (2000)
-
[Publications] Satoshi Matsuoka: "A Ja.Pack;A Performance Portable Parallel Java Numerical Library"Proceedings of the ACM 2000 Java Grande Conference. 140-149 (2000)
-
[Publications] 松岡聡: "PCクラスタにおけるEthernetによる高速ユーザレベルバリアの性能評価"2000-HPC-82. 2000. 131-136
-
[Publications] 松岡聡: "MPC++Multi-Thread Template Libraryの様々な通信レイヤ上での実装と性能評価"2000-HPC-82. 2000. 137-142
-
[Publications] Satoshi Matsuoka: "Implementation of a Portable Software DSM in Java"Proceedings of ACM Java Grande/ISCOPE 2001. (掲載予定). (2001)
-
[Publications] 小川宏高: "Java向けソフトウェア分散共有メモリの実現"情報処理学会論文誌:プログラミング. 2000(掲載予定).