• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2016 Fiscal Year Annual Research Report

Real-time Analytics Frameworks for Big Heterogeneous Data in Composite Parallel Computing Environments

Research Project

Project/Area Number 26280037
Research InstitutionUniversity of Tsukuba

Principal Investigator

北川 博之  筑波大学, 計算科学研究センター, 教授 (00204876)

Co-Investigator(Kenkyū-buntansha) 天笠 俊之  筑波大学, 計算科学研究センター, 准教授 (70314531)
塩川 浩昭  筑波大学, 計算科学研究センター, 助教 (90775248)
早瀬 康裕  筑波大学, システム情報系, 助教 (40423090)
渡辺 知恵美  筑波大学, システム情報系, 助教 (20362832)
Project Period (FY) 2014-04-01 – 2017-03-31
Keywords大規模不均質データ / データ分析 / 複合型並列計算環境
Outline of Annual Research Achievements

大規模不均質データ分析フレームワークに関しては,JSONを対象に,小粒度処理と大粒度処理を統合的に実行できるフレームワークJsFlowを開発した.これは,ストア型JSONとストリーム型JSONの両者が混在する処理フロータスクを実行可能なシステムである.プロトタイプ開発に当たっては,これまでのSparkに加えて,より柔軟性の高いFlinkを用いたシステムの開発を行い,複数のタスクを対象とした評価実験を行った.
大粒度・小粒度分析処理の高速化に関しては,昨年度に続いて,大粒度分析の並列処理と分散ストリーム処理に基づく小粒度処理に関する研究の高度化を進めた.大粒度分析に関しては,GPUを用いた類似結合の高速化とSIFT特徴量を用いた類似画像検索の高速化を実現した.また,新たにメニーコアプロセッサを用いたデータ分析高速化についても研究を推進した.具体的には,構造的類似度に基づくグラフクラスタリング,集合間類似結合の高速化である.さらに,大規模グラフに対するObjectRank計算の高速化手法を開発した他,差分処理を用いた動的なデータ集合に対する対話的外れ値分析フレームワークDIOの開発と,不均質高次元データの逆ランク検索の効率化手法の開発を行った.小粒度処理に関しては,複数のリレーションストリームを対象としたキーワード検索において,キーワード数やリレーション数が増加しても性能劣化が生じにくい新たな手法の開発を行った他,オンラインニュースの地域局所的な注目度の分析の手法を開発した.
また,大粒度・小粒度分析処理の融合に関しては,上記JsFlowにおいて,計算資源制約や分析粒度要求等を加味したデータ処理記述の解析により,小粒度処理と大粒度処理を適切に切り分け,並列差分処理や中間データの維持管理をも考慮した実行プランを生成するための基本方式の開発を行い,実験評価によりその有効性を確認した.

Research Progress Status

28年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

28年度が最終年度であるため、記入しない。

Causes of Carryover

28年度が最終年度であるため、記入しない。

Expenditure Plan for Carryover Budget

28年度が最終年度であるため、記入しない。

  • Research Products

    (22 results)

All 2017 2016

All Journal Article (8 results) (of which Peer Reviewed: 8 results,  Open Access: 8 results,  Acknowledgement Compliant: 8 results) Presentation (14 results) (of which Int'l Joint Research: 7 results)

  • [Journal Article] SCAN-XP: Parallel Structural Graph Clustering Algorithm on Intel Xeon Phi Coprocessors2017

    • Author(s)
      Tomokatsu Takahashi, Hiroaki Shiokawa, Hiroyuki Kitagawa
    • Journal Title

      Proc. 2nd ACM SIGMOD Workshop on Network Data Analytics (NDA 2017)

      Volume: - Pages: to appear

    • DOI

      to appear

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Grid-Index Algorithm for Reverse Rank Queries2017

    • Author(s)
      Yuyang Dong, Hanxiong Chen, Jeffrey Xu Yu, Kazutaka Furuse
    • Journal Title

      Proc. 20th International Conference on Extending Database Technology (EDBT 2017

      Volume: - Pages: 306-317

    • DOI

      https://openproceedings.org/2017/conf/edbt/paper-11.pdf

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Accelerating Set Similarity Joins Using GPUs2016

    • Author(s)
      Mateus S. H. Cruz,Yusuke Kozawa, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Transactions on Large-Scale Data and Knowledge-Centered Systems XXVIII: Special Issue on Database and Expert Systems Applications (TLDKS)

      Volume: - Pages: 1-22

    • DOI

      10.1007/978-3-662-53455-7_1

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Local Attention Analysis and Prediction of Online News Articles in Twitter2016

    • Author(s)
      Saki Nagaki, Yuto Yamaguchi, Toshiyuki Amagasa, and Hiroyuki Kitagawa
    • Journal Title

      International Workshop On Mobile Ubiquitous Systems, Infrastructures, Communications, And Applications (MUSICAL 2016)

      Volume: - Pages: 131-136

    • DOI

      10.1145/3004010.3004042

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] JsFlow: Integration of Massive Streams and Batches via JSON-based Dataflow Algebra2016

    • Author(s)
      Hirotoshi Cho, Hiroaki Shiokawa and Hiroyuki Kitagawa
    • Journal Title

      Proc. 19th International Conference on Network-Based Information Systems (NBiS 2016)

      Volume: - Pages: 188-195

    • DOI

      10.1109/NBiS.2016.1

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] GPU Acceleration of Content-based Image Retrieval based on SIFT Descriptors2016

    • Author(s)
      Yuta Kusamura, Yusuke Kozawa, Toshiyuki Amagasa, and Hiroyuki Kitagaw
    • Journal Title

      Proc. the 5th International Workshop on Advances in Data Engineering and Mobile Computing in conjunction with NBiS2016(DEMoC2016)

      Volume: - Pages: 342-347

    • DOI

      10.1109/NBiS.2016.55

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] An Improved Method of Keyword Search over Relational Data Streams by Aggressive Candidate Network Consolidation2016

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Proc. 27th International Conference on Database and Expert Systems Applications (DEXA 2016)

      Volume: - Pages: 336-351

    • DOI

      10.1007/978-3-319-44403-1_21

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Journal Article] Collaborative Filtering with Implicit Feedbacks by Discounting Positive Feedbacks2016

    • Author(s)
      Kento Kawai, Hiroyuki Kitagawa
    • Journal Title

      Proc. 2nd IEEE International Conference on Multimedia Big Data (IEEE BigMM 2016)

      Volume: - Pages: 41-48

    • DOI

      10.1109/BigMM.2016.30

    • Peer Reviewed / Open Access / Acknowledgement Compliant
  • [Presentation] SCAN-XP: Parallel Structural Graph Clustering Algorithm on Intel Xeon Phi Coprocessors2017

    • Author(s)
      Tomokatsu Takahashi, Hiroaki Shiokawa, Hiroyuki Kitagawa
    • Organizer
      2nd ACM SIGMOD Workshop on Network Data Analytics (NDA 2017)
    • Place of Presentation
      Hilton Chicago(アメリカ合衆国・シカゴ)
    • Year and Date
      2017-05-19 – 2017-05-19
    • Int'l Joint Research
  • [Presentation] Grid-Index Algorithm for Reverse Rank Queries2017

    • Author(s)
      Yuyang Dong, Hanxiong Chen, Jeffrey Xu Yu, Kazutaka Furuse, Hiroyuki Kitagawa
    • Organizer
      20th International Conference on Extending Database Technology (EDBT 2017)
    • Place of Presentation
      Congress Center of the San Servolo Island(イタリア・ベニス)
    • Year and Date
      2017-03-21 – 2017-03-24
    • Int'l Joint Research
  • [Presentation] 大規模グラフに対する逐次的なノードの枝刈りを用いたObjectRankの高速化2017

    • Author(s)
      佐藤 朋紀, 塩川 浩昭, 北川 博之
    • Organizer
      情報処理学会第79回全国大会 (IPSJ全国大会 2017)
    • Place of Presentation
      名古屋大学(愛知県名古屋市)
    • Year and Date
      2017-03-16 – 2017-03-18
  • [Presentation] メニーコアプロセッサを用いた集合間類似結合の高速化2017

    • Author(s)
      菅野 健太, 天笠 俊之, 北川 博之
    • Organizer
      情報処理学会第79回全国大会 (IPSJ全国大会 2017)
    • Place of Presentation
      名古屋大学(愛知県名古屋市)
    • Year and Date
      2017-03-16 – 2017-03-18
  • [Presentation] ストリーム処理とバッチ処理の統合と実行最適化2017

    • Author(s)
      長 裕敏, 塩川 浩昭, 北川 博之
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017)
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] メニーコアプロセッサを用いた構造的類似度に基づくグラフクラスタリングの高速化2017

    • Author(s)
      高橋 知克, 塩川 浩昭, 北川 博之
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017)
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] SIFT特徴量を用いた画像検索のGPUによる高速化2017

    • Author(s)
      草村 優太, 天笠 俊之, 北川 博之
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017)
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] 大規模グラフに対するObjectRankの高速化2017

    • Author(s)
      佐藤 朋紀, 塩川 浩昭, 山口 祐人, 北川 博之
    • Organizer
      第9回データ工学と情報マネジメントに関するフォーラム (DEIM 2017)
    • Place of Presentation
      高山グリーンホテル(岐阜県高山市)
    • Year and Date
      2017-03-06 – 2017-03-08
  • [Presentation] Local Attention Analysis and Prediction of Online News Articles in Twitter2016

    • Author(s)
      Saki Nagaki, Yuto Yamaguchi, Toshiyuki Amagasa, and Hiroyuki Kitagawa
    • Organizer
      International Workshop On Mobile Ubiquitous Systems, Infrastructures, Communications, And Applications (MUSICAL 2016)
    • Place of Presentation
      広島国際会議場(広島県広島市)
    • Year and Date
      2016-11-28 – 2016-12-01
    • Int'l Joint Research
  • [Presentation] データの動的な変化に対応可能な対話的外れ値分析2016

    • Author(s)
      坂詰知完, 北川博之, 天笠俊之
    • Organizer
      第9回Webとデータベースに関するフォーラム (WebDB Forum 2016)
    • Place of Presentation
      慶應義塾大学(神奈川県横浜市)
    • Year and Date
      2016-09-13 – 2016-09-15
  • [Presentation] GPU Acceleration of Content-based Image Retrieval based on SIFT Descriptors2016

    • Author(s)
      Yuta Kusamura, Yusuke Kozawa, Toshiyuki Amagasa, and Hiroyuki Kitagawa
    • Organizer
      5th International Workshop on Advances in Data Engineering and Mobile Computing in conjunction with NBiS2016 (DEMoC 2016)
    • Place of Presentation
      Technical University of Ostrava(チェコ・オストラバ)
    • Year and Date
      2016-09-07 – 2016-09-09
    • Int'l Joint Research
  • [Presentation] JsFlow: Integration of Massive Streams and Batches via JSON-based Dataflow Algebra2016

    • Author(s)
      Hirotoshi Cho, Hiroaki Shiokawa and Hiroyuki Kitagawa
    • Organizer
      19th International Conference on Network-Based Information Systems (NBiS 2016)
    • Place of Presentation
      Technical University of Ostrava(チェコ・オストラバ)
    • Year and Date
      2016-09-07 – 2016-09-09
    • Int'l Joint Research
  • [Presentation] An Improved Method of Keyword Search over Relational Data Streams by Aggressive Candidate Network Consolidation2016

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Organizer
      27th International Conference on Database and Expert Systems Applications (DEXA 2016)
    • Place of Presentation
      Instituto Superior de Engenharia do Porto(ポルトガル・ポルト)
    • Year and Date
      2016-09-05 – 2016-09-08
    • Int'l Joint Research
  • [Presentation] Collaborative Filtering with Implicit Feedbacks by Discounting Positive Feedbacks2016

    • Author(s)
      Kento Kawai, Hiroyuki Kitagawa
    • Organizer
      2nd IEEE International Conference on Multimedia Big Data (IEEE BigMM 2016)
    • Place of Presentation
      Howard Civil Service International House(台湾・台北)
    • Year and Date
      2016-04-20 – 2016-04-22
    • Int'l Joint Research

URL: 

Published: 2018-01-16  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi