• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

品質を保証するEnd-to-Endビッグデータ近似処理技術に関する研究

研究課題

研究課題/領域番号 23K24850
補助金の研究課題番号 22H03594 (2022-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2022-2023)
応募区分一般
審査区分 小区分60080:データベース関連
研究機関名古屋大学

研究代表者

石川 佳治  名古屋大学, 情報学研究科, 教授 (80263440)

研究分担者 杉浦 健人  名古屋大学, 情報学研究科, 助教 (10821663)
駒水 孝裕  名古屋大学, 数理・データ科学教育研究センター, 准教授 (30756367)
研究期間 (年度) 2022-04-01 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2025年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2022年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
キーワード近似的問合せ / 問合せ処理 / 品質保証 / ビッグデータ処理 / データベースシステム / データの品質 / データストリーム
研究開始時の研究の概要

近年大いに着目されている近似的問合せのアプローチをビッグデータ処理のワークフロー全体に展開する,End-to-Endの近似的ビッグデータ処理の技術を確立する.コンパクトな要約情報を活用することと,ビッグデータ処理プロセスを通じて近似的データ処理の統合モデルを用いることで,従来型のビッグデータ処理に比べ大幅な速度向上を達成し,システム全体での近似品質の統一的な管理を可能とする.また,近似の品質と処理効率のトレードオフを適切に制御できることが重要であるため,本研究では求められた近似品質を満たすようにビッグデータ処理のワークフローを制御する品質駆動型の近似的データ処理技術を開発する.

研究実績の概要

本研究は,(A)近似的データ処理の統合モデルの開発,(B)機械学習を導入した近似的データ処理法の開発,(C)ビッグデータ処理システムにおけるEnd-to-End近似処理技術の開発,(D)品質駆動型の近似的データ処理技術の開発,(E)システムプロトタイプの実現と評価,の5つのサブテーマからなる.令和5年度は特に(C)と(D)を中心に研究を進めると予定をしていたが(A), (B)についても一定の進展があった.
研究実績で大きいものの一つは(C)に関するもので,ストリーム環境においてセンシングなどの入り口から最終的な処理に至るまで,品質を管理しながら近似的にデータの集計等を行う問合せ処理技術を開発した.この研究は論文誌に採録されるに至った.
また,(D)に関しては,ユーザが指定した品質の条件を満たす,近似的なデータベース処理技術の開発を行った.データベースの内容をコンパクトに表現するシノプシスというデータ構造を作成するが,近似手法に新規性があり,従来手法に比べよりコンパクトかつ精度を高めた手法となっている.令和5年度には研究会での発表などを行い,国際会議や論文誌への投稿をするに至った.
さらに令和5年度は(B)に関連するトピックとして,因果推論の技術をデータベースに適用し,曖昧な情報が蓄積されたデータベースに対してより精度の高い推論を含むデータベース問合せの技術開発に着手した.
これ以外にも,グラフ構造を持ったデータに対する近似的な問合せ処理技術の開発なども行い,次年度につながるアイデアが得られた.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

今年度は業績そのものの件数は予定よりは少なかったものの,研究の進展が著しく,令和6年度に向けての国際会議や学術雑誌への投稿を行うことができた.この報告を書いている5月時点で,それらの論文が採録・採択されており,結果的には良い成果を生むことができた.また,新たなトピックへの展開もあった.

今後の研究の推進方策

当初の計画に従って進めていく予定であるが,特にデータベースに対するコンパクトなシノプシスを用いた問合せ処理技術については成果がいろいろと得られており,これらを早々にまとめたいと考えている.また,因果推論との近似的データベース問合せ処理との関わりについても進展をさせたいと検討を重ねている.また,近似的問合せ処理には従来からサンプリングも活用されてきたが,今後はサンプリング技術の併用も行いたいと考えている.

報告書

(2件)
  • 2023 実績報告書
  • 2022 実績報告書
  • 研究成果

    (17件)

すべて 2024 2023 2022

すべて 雑誌論文 (2件) (うち査読あり 2件、 オープンアクセス 2件) 学会発表 (15件) (うち国際学会 2件、 招待講演 1件)

  • [雑誌論文] エッジコンピューティング環境を想定した近似的な耐障害性保証に基づくウォータマーク制御手法2024

    • 著者名/発表者名
      高尾 大樹、杉浦 健人、石川 佳治、陸 可鏡
    • 雑誌名

      電子情報通信学会論文誌D 情報・システム

      巻: J107-D 号: 5 ページ: 335-347

    • DOI

      10.14923/transinfj.2023DEP0007

    • ISSN
      1880-4535, 1881-0225
    • 年月日
      2024-05-01
    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] MQH: Locality Sensitive Hashing on Multi-level Quantization Errors for Point-to-Hyperplane Distances2022

    • 著者名/発表者名
      Kejing Lu, Yoshiharu Ishikawa, Chuan Xiao
    • 雑誌名

      Proceedings of the VLDB Endowment

      巻: 16 号: 4 ページ: 864-876

    • DOI

      10.14778/3574245.3574269

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] Acceleration of Synopsis Construction for Approximate Query Processing2024

    • 著者名/発表者名
      Tianjia Ni, Kento Sugiura, Yoshiharu Ishikawa, Kejing Lu
    • 学会等名
      The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search2024

    • 著者名/発表者名
      Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa
    • 学会等名
      International Conference on Machine Learning
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 誤差保証付き近似的問合せ処理におけるシノプシス構築の高速化2024

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 来歴情報を活用したデータベースからの因果推論2024

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 因果推論に基づくデータベースからの仮説問合せについて2024

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      情報処理学会第86回全国大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 誤差上限付き近似問合せ処理におけるシノプシス構築の高速化2023

    • 著者名/発表者名
      堀崎 祥, 倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 近似的問合せ処理におけるシノプシス構築の高速化2023

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習によるグラフベース近似最近傍探索の高速化2023

    • 著者名/発表者名
      菅 寧, 陸 可鏡, 杉浦 健人, 石川 佳治
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] エッジコンピューティング環境を想定した近似的な耐障害性保証に基づくデータストリーム処理システム2023

    • 著者名/発表者名
      高尾 大樹, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Approximate Database Query Processing with Error Guarantees2023

    • 著者名/発表者名
      Yoshiharu Ishikawa
    • 学会等名
      International Conference on Ubiquitous Information Management and Communication (IMCOM 2023)
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 近似的問合せ処理における問合せ高速化のための誤差保証条件の検討2022

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      WebDB夏のワークショップ2022, 情報処理学会研究報告データベースシステム (DBS)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習を用いた検索エッジ数の推定によるグラフベース近似最近傍探索の高速化2022

    • 著者名/発表者名
      菅 寧, 陸 可鏡, 石川 佳治, 杉浦 健人
    • 学会等名
      第21回情報科学技術フォーラム (FIT 2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 近似的な耐障害性保証に基づくエッジストリーム処理システムの開発2022

    • 著者名/発表者名
      高尾 大樹
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 問合せ処理の高速化に基づくシノプシスの誤差保証条件について2022

    • 著者名/発表者名
      倪 天嘉
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習を用いた検索エッジ数の推定によるグラフベース近似最近傍探索の高速化2022

    • 著者名/発表者名
      菅 寧
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi