• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Annual Research Report

Research on Augmented Real Big Data Processing Frameworks with High-level Virtualization Facilities

Research Project

Project/Area Number 19H04114
Research InstitutionUniversity of Tsukuba

Principal Investigator

北川 博之  筑波大学, 国際統合睡眠医科学研究機構, 教授 (00204876)

Co-Investigator(Kenkyū-buntansha) 天笠 俊之  筑波大学, 計算科学研究センター, 教授 (70314531)
塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)
早瀬 康裕  筑波大学, システム情報系, 助教 (40423090)
堀江 和正  筑波大学, 計算科学研究センター, 助教 (60817112)
Project Period (FY) 2019-04-01 – 2023-03-31
Keywordsビッグデータ / 仮想化
Outline of Annual Research Achievements

本研究課題では,Augmentedリアルビッグデータ利活用基盤の構築を目標に,研究期間中に(1) 高水準ビッグデータ処理記述,(2) データの曖昧性や整合性管理,(3) 全体処理効率化に関わる研究開発を行うことを目的として研究を推進した.
2022年度は,以下のような研究成果を得た.
(1) 高水準ビッグデータ処理記述:機械学習や時空間データ処理等に関わるAugmentedデータ処理を含む複合的分析プロセスを記述できる手法について,リレーショナルデータベース,時空間Augmentedストリーム処理に加えて,機械学習に関わるAugmentedストリーム処理の実現を行った.また,RDF知識処理モデルにおけるAugmentedデータ処理についても,外部情報源をAugmentedデータとして知識ベース処理に統合するKnowledge Mediatorを開発し,プロトタイプシステムとそれを用いた評価を行った.
(2) データの曖昧性や整合性管理:Augmentedデータ処理を含む複合的分析プロセスにおける元データと分析結果の関連性,整合性,トレーサビリティ管理方式である拡張来歴について,これまでに開発したリレーショナルデータベースを用いたシステムに加えて,Flinkを用いたストリーム処理における実現を行った.
(3) 全体処理効率化:リレーショナルデータベースにおける拡張来歴導出の効率化手法としてFunction materializationを提案し,定量的性能評価実験によりその有効性を確認した.また,ストリーム処理における拡張来歴導出についても各種性能評価を行い,機械学習等の高コスト演算がある状況では拡張来歴導出のためのオーバヘッドは極めて小さいことを確認した.さらに,Augmentedデータ取得のための機械学習処理やデータマイニング処理等の処理効率化手法について検討を行った.

Research Progress Status

令和4年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

令和4年度が最終年度であるため、記入しない。

  • Research Products

    (15 results)

All 2023 2022

All Journal Article (11 results) (of which Peer Reviewed: 11 results,  Open Access: 4 results) Presentation (4 results) (of which Int'l Joint Research: 1 results,  Invited: 1 results)

  • [Journal Article] BPF: A Novel Cluster Boundary Points Detection Method for Static and Streaming Data2023

    • Author(s)
      Vijdan Khalique, Hiroyuki Kitagawa, and Toshiyuki Amagas
    • Journal Title

      Knowledge and Information System

      Volume: - Pages: -

    • DOI

      10.1007/s10115-023-01854-1

    • Peer Reviewed / Open Access
  • [Journal Article] CPiX: Real-Time Analytics Over Out-of-Order Data Streams by Incremental Sliding-Window Aggregation2022

    • Author(s)
      Savong Bou, Hiroyuki Kitagawa, Toshiyuki Amagasa
    • Journal Title

      IEEE Transactions on Knowledge and Data Engineering

      Volume: 34 Pages: 5239-5250

    • DOI

      10.1109/TKDE.2021.3054898

    • Peer Reviewed / Open Access
  • [Journal Article] GeoFlink: An Efficient and Scalable Spatial Data Stream Management System2022

    • Author(s)
      Salman Ahmed Shaikh, Hiroyuki Kitagawa, Akiyoshi Matono, Komal Mariam, and Kyoung-Sook Kim
    • Journal Title

      IEEE Access

      Volume: 10 Pages: 24909-24935

    • DOI

      10.1109/ACCESS.2022.3154063

    • Peer Reviewed / Open Access
  • [Journal Article] Augmented Lineage: Traceability of Data Analysis Including Complex UDF Processing2022

    • Author(s)
      Masaya Yamada, Hiroyuki Kitagawa, Toshiyuki Amagasa, Akiyoshi Maton
    • Journal Title

      The VLDB Journal

      Volume: - Pages: -

    • DOI

      10.1007/s00778-022-00769-7

    • Peer Reviewed / Open Access
  • [Journal Article] BPF: An Effective Cluster Boundary Points Detection Technique2022

    • Author(s)
      Vijdan Khalique and Hiroyuki Kitagawa
    • Journal Title

      Proc. 33rd International Conference on Database and Expert Systems Applications (DEXA 2022)

      Volume: 1 Pages: 404-416

    • DOI

      10.1007/978-3-031-12423-5_31

    • Peer Reviewed
  • [Journal Article] InTrans: Fast Incremental Transformer for Time Series Data Prediction2022

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa
    • Journal Title

      Proc. 33rd International Conference on Database and Expert Systems Applications (DEXA 2022

      Volume: 2 Pages: 47-61

    • DOI

      10.1007/978-3-031-12426-6_4

    • Peer Reviewed
  • [Journal Article] TStream: A Framework for Real-time and Scalable Trajectory Stream Processing and Analysis2022

    • Author(s)
      Salman Ahmed Shaikh, Hiroyuki Kitagawa, Akiyoshi Matono, Kyoung-Sook Kim
    • Journal Title

      Proc. 30th ACM SIGSPATIAL International Conference on Advances in Geographic Information Systems 2022 (ACM SIGSPATIAL 2022)

      Volume: - Pages: -

    • DOI

      10.1145/3557915.3560964

    • Peer Reviewed
  • [Journal Article] Streaming Augmented Lineage: Traceability of Complex Stream Data Analysis2022

    • Author(s)
      Masaya Yamada, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Toshiyuki Amagasa, Akiyoshi Matono
    • Journal Title

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      Volume: - Pages: 224-236

    • DOI

      10.1007/978-3-031-21047-1_20

    • Peer Reviewed
  • [Journal Article] PR-MVI: Efficient Missing Value Imputation over Data Streams by Distance Likelihood2022

    • Author(s)
      Savong Bou, Toshiyuki Amagasa, Hiroyuki Kitagawa, Salman Ahmed Shaikh, Akiyoshi Matono
    • Journal Title

      Proc. 24th International Conference on Information Integration and Web Intelligence (iiWAS2022)

      Volume: - Pages: 338-351

    • DOI

      10.1007/978-3-031-21047-1_28

    • Peer Reviewed
  • [Journal Article] An FPGA-based Accelerator for Regular Path Queries over Edge-labeled Graphs2022

    • Author(s)
      Kento Miura, Ryohei Kobayashi, Toshiyuki Amagasa, Hiroyuki Kitagawa, Norihisa Fujita, and Taisuke Boku
    • Journal Title

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      Volume: - Pages: 415-422

    • DOI

      10.1109/BigData55660.2022.10020406

    • Peer Reviewed
  • [Journal Article] Region-based Sub-Snapshot (RegSnap): Enhanced Fault Tolerance in Distributed Stream Processing with Partial Snapshot2022

    • Author(s)
      Takdir, Hiroyuki Kitagawa, and Toshiyuki Amagasa
    • Journal Title

      Proceedings of 2022 IEEE International Conference on Big Data (IEEE BigData2022)

      Volume: - Pages: 3374-3382

    • DOI

      10.1109/BigData55660.2022.10020607

    • Peer Reviewed
  • [Presentation] エンティティリンキング機能を有する知識ベースと外部情報源の統合利用手法2023

    • Author(s)
      大森雄基, 北川博之, 天笠俊之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM 2023)
  • [Presentation] 複合的ストリーム処理に対するトレーサビリティの研究2023

    • Author(s)
      山田真也, 北川博之, Salman Ahmed Shaikh, 天笠俊之, 的野晃
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM 2023)
  • [Presentation] リアルタイム性を考慮した自動睡眠ステージ判定システムの設計2023

    • Author(s)
      国生泰資, 山田空, 堀江和正, 阿部高志, 北川博之
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム (DEIM 2023)
  • [Presentation] Big Sequence Data Analysis: From Stream Processing Technology to Applications in Sleep Medicine2022

    • Author(s)
      Hiroyuki Kitagawa
    • Organizer
      IRI2022
    • Int'l Joint Research / Invited

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi