2004 Fiscal Year Annual Research Report
大規模分散データの真に透過で効率的な共有を実現する分散共有配列システムの開発
Project/Area Number |
16016226
|
Research Institution | The University of Tokyo |
Principal Investigator |
清水 謙多郎 東京大学, 大学院・農学生命科学研究科, 教授 (80178970)
|
Co-Investigator(Kenkyū-buntansha) |
中村 周吾 東京大学, 大学院・農学生命科学研究科, 助教授 (90272442)
寺田 透 東京大学, 大学院・農学生命科学研究科, 特任助教授 (40359641)
|
Keywords | 並列計算 / 分散共有メモリ / グリッドコンピューティング / ミドルウェア / 資源管理 |
Research Abstract |
本研究では、科学技術計算の応用に対し、物理的に分散するメモリ領域を統合し巨大な共有メモリが存在するかのように利用できるようにするとともに、メモリアクセスの効率化のために、データのレプリケーションおよびマイグレーションを自動的に行い、データ一貫性について利用者が明示的な指定を含めてアプリケーションに適した方式が選択できるようなシステムを構築する。申請者らは、本システムをDSA(Distributed Shared Array)と名付け、その開発を行った。今年度はとくに、利用者には、同一計算機におけるデータ共有とまったく同じように、物理的な分散に対して真に透過なデータ共有を実現するとともに、配列ベースで(配列の要素や領域を単位として)データのレプリケーションおよびマイグレーションを自動的に行う機構を開発した。配列は、アプリケーションに適した形状の「ブロック」を単位に管理され、要素に対するアクセスは、ブロックのレプリカ上で行われる。ブロックは、部分レプリカの作成と一貫性制御の単位となるので、アプリケーションに適した形状が定義できることが重要である。とくに、アプリケーションのアクセスパターンに即した形状を定義することによって、false sharingを抑止し、大きな粒度で効率的な一貫性制御を行うことができると期待される。分散共有配列が多次元の場合は、ブロックは多次元のボックス型の形状をとることが可能である。また、DSAでは強一貫性を実現するため、ロックの獲得・解放は自動で強制的に行う。ロックには、ブロックの並行読み出し、並行書き込みを許すロックをもたせた。また、ロックの解放に対しては、ロックにageをもたせる手法を開発した。ageの初期値は0とし、スレッドがそれまでと異なるブロックにアクセスしたときに、ロックのageはインクリメントされる。
|