研究課題
今年度は、1.大規模XMLデータの分割およびその分散問合せ処理、ならびに2.分散XMLデータ処理を支援する問合せエンジンに関して、それぞれ研究を行なった。まず、1.に関して、大規模なXMLデータを処理するために、XMLデータを分割し、それらを複数の計算機に配置した上で、問合せを効率良く処理する手法を提案した。また、分散処理運用時の負荷分散を考慮し、CPUコストとストレージコストを両立させることにより、効率のよい問合せ処理を実現する方式を実装し、その評価を行った。具体的にはXMLデータの構造を意識しつつ、可能な限り同一のサイズに分割するアルゴリズムによりデータを分割し、分割されたデータフラグメントを各計算ノードに複数個ずつ配置する。頻繁にアクセスされ、CPUコストを増加させるフラグメントと、ほとんどアクセスされずCPUコストが低いフラグメントを動的に交換することを繰り返すことにより、ストレージコストを均一にしたままCPUコスト(負荷)の均衡化を実現した。次に、2.の分散XMLデータ処理を支援する問合せエンジンの項目に関しては、DTMとよばれる表形式のXMLデータの表現方式を利用した問合せエンジンを開発し、小型の計算機上でも効率よくXML問合せが可能となった。また、データのスキャンアクセスと索引アクセス時とでI/O粒度を変更し、さらなる効率化を達成している。オンメモリ上でも表形式データのランダムアクセスを効率よく行うBitmap-based Data Transfer方式を提案し、従来のメモリアクセス方式よりも高速な表アクセスを実現した。さらに、分散XMLデータ処理を効率よく行うために、クエリシッピング方式を拡張して、部分間合せ結果を具体化せずに、プロキシとして未完成の問合せ結果をクライアント計算機に返すことで、サーバの負担の少ない分散問合せ処理方式を開発した。
すべて 2007 2006
すべて 雑誌論文 (6件)
電子情報通信学会論文誌 Vo1.J90-D,No.2
ページ: 337-348
第18回データ工学ワークショップ(DEWS2007)論文集
電子情報通信学会 2007総合大会論文集
Proc. of IEEE 21st International Conference on Advanced Information Networking and Applications
情報処理学会論文誌データベース TOD34
情報処理学会研究報告 Vo1.2006,No.77
ページ: 87-94