• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 研究成果報告書

大規模データ処理基盤におけるデータ空間の生成演算と更新方式に関する研究

研究課題

  • PDF
研究課題/領域番号 24500109
研究種目

基盤研究(C)

配分区分基金
応募区分一般
研究分野 メディア情報学・データベース
研究機関電気通信大学

研究代表者

大森 匡  電気通信大学, その他の研究科, 教授 (30233274)

研究期間 (年度) 2012-04-01 – 2016-03-31
キーワード大規模データ処理 / MapReduce / 類似結合 / 多対多関係 / 編集距離 / ハッシュ結合
研究成果の概要

大量データ上の多対多関係情報の抽出を行う類似結合演算の計算技法は従来から多くあるが,mapreduce上では,計算モデルに特有な性能の不安定さがあり,大量データ処理演算として確立していなかった.本研究では,この不安定さを解決する汎用的なアルゴリズム効率化戦略として,(i) 多対多等結合で微小なデータ偏りが引き起こす負荷偏在を解決する技法HSJ+BR,および,(ii) 類似結合算法が使うレコードコピー量とshuffleコストを抑制する2段階ハッシュ分割戦略による効率化技法,の2つを提案して,編集距離結合など多様な類似結合計算のmapreduce上の不安定さを解決する戦略として有効性を示した.

自由記述の分野

データベース・データ工学

URL: 

公開日: 2017-05-10  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi