研究概要 |
増加の一途のデータの解析に対し,複数の拠点による広域分散データ解析の要求が高まっている。そのためには広域ファイルシステムが有用であるが,データ解析の規模が拡大するにつれ,ファイルを管理するメタデータのアクセス負荷の増大,広域ネットワークの遅延による応答性の低下が問題となっている。本年度は広域分散データ解析が必要とする性能を達成するためのシステムアーキテクチャの検討と応答性向上に有効なクラスタ間高速ファイル複製作成に関するアルゴリズムの検討を実施した。システムアーキテクチャの検討では、マルチマスタ構成をとる分散メタデータサーバに関する研究を行った。各拠点にメタデータサーバを分散配置し、それぞれのメタデータサーバでのファイルシステムメタデータの更新を許すことにより、応答時間の短縮を図る。ここで、各拠点のメタデータサーバの更新に対し衝突が起こらないことを保証すると、応答時間の短縮を図ることができないため、広域でのファイル共有において問題が起こらない程度にファイルシステムのセマンティクスの緩和を図った。結果整合性を保証するマルチマスタ構成の分散メタデータサーバのアーキテクチャ設計し、初期性能評価を行った。クラスタ間高速ファイル転送の研究としては、本年度はサイトAに保持している多数のファイルをサイトBに効率的に転送するためのスケジューリングの課題に取組、転送ファイルスケジューリングアルゴリズム、複製選択アルゴリズム、転送前動的ファイル複製作成アルゴリズムを提案し性能評価を行った。
|