2005 Fiscal Year Annual Research Report
大規模分散データの真に透過で効率的な共有を実現する分散共有配列システムの開発
Project/Area Number |
16016226
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 東京大学, 大学院・農学生命科学研究科, 教授 (80178970)
|
Keywords | ハイパフォーマンス・コンピューティング / ソフトウェア学 / ネットワーク / 生体生命情報学 |
Research Abstract |
本研究では、分散メモリ型システムを用いて巨大なメモリ領域を利用することができる、共有メモリプログラミングモデルにもとづく新しい並列プログラミング環境DSA(Distributed Shared Array)を開発する。DSAは、分散システムの上に、巨大なメモリ領域を仮想的に構築する。データの実体は、それぞれの計算機のメモリやディスクに分散して置かれるが、すべての計算機が、こうした物理的なデータの分散を意識しないで、グローバルなメモリ領域を共有できるようにすることにより、並列計算を行うプログラムの開発を容易にする。1台の計算機のメモリやディスクに格納しきれない巨大なデータも、この仮想的なメモリに置いて複数の計算機から共通に操作することができる。科学技術計算でよく用いられるベクトルや行列をこの巨大なメモリに格納して操作することにより、巨大なベクトルや行列を扱うプログラムも、分散システムの上でこれまでより簡単に開発できるようになり、しかも高速に実行できるようになる。データの実体は分散していても、利用者には、複数の計算機間で共有できるグローバルな配列が存在しているように見える。このような配列を「分散共有配列(DSA)」と呼んでいる。本研究では、DSAを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の実際のアプリケーションに対して適用し、クラスタ型計算機上で性能評価を行い、分散するデータを効率的に操作・管理できること、MPIのプログラムと比較して、ノード数が増大してもスケーラブルな性能が得られることを確認し、本システムの有効性を実証した。その結果、数十台規模のクラスタシステムにおいて、高いスケーラビリティを実現した。
|
Research Products
(5 results)