研究課題
本研究では、分散メモリ型システムを用いて巨大なメモリ領域を利用することができる、共有メモリプログラミングモデルにもとづく新しい並列プログラミング環境DSA(Distributed Shared Array)を開発する。DSAは、分散システムの上に、巨大なメモリ領域を仮想的に構築する。データの実体は、それぞれの計算機のメモリやディスクに分散して置かれるが、すべての計算機が、こうした物理的なデータの分散を意識しないで、グローバルなメモリ領域を共有できるようにすることにより、並列計算を行うプログラムの開発を容易にする。1台の計算機のメモリやディスクに格納しきれない巨大なデータも、この仮想的なメモリに置いて複数の計算機から共通に操作することができる。科学技術計算でよく用いられるベクトルや行列をこの巨大なメモリに格納して操作することにより、巨大なベクトルや行列を扱うプログラムも、分散システムの上でこれまでより簡単に開発できるようになり、しかも高速に実行できるようになる。データの実体は分散していても、利用者には、複数の計算機間で共有できるグローバルな配列が存在しているように見える。このような配列を「分散共有配列(DSA)」と呼んでいる。本研究では、DSAを、遺伝子クラスタリング、配列のマルチプルアラインメント、分子動力学計算など、生命情報科学の実際のアプリケーションに対して適用し、クラスタ型計算機上で性能評価を行い、分散するデータを効率的に操作・管理できること、MPIのプログラムと比較して、ノード数が増大してもスケーラブルな性能が得られることを確認し、本システムの有効性を実証した。その結果、数十台規模のクラスタシステムにおいて、高いスケーラビリティを実現した。
すべて 2006 2005
すべて 雑誌論文 (5件)
Symposium of Data Ming and Computations in Statistics
Proceedings of the 16th International Conference on Genome Informatics (GIW2005) 16, 2
ページ: 161-173
FEBS Journal 272
ページ: 4938-4948
Journal of Molecular Biology 351
ページ: 355-370
Journal of Bacteriology 187
ページ: 2483-2490