• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

品質を保証するEnd-to-Endビッグデータ近似処理技術に関する研究

研究課題

研究課題/領域番号 23K24850
補助金の研究課題番号 22H03594 (2022-2023)
研究種目

基盤研究(B)

配分区分基金 (2024)
補助金 (2022-2023)
応募区分一般
審査区分 小区分60080:データベース関連
研究機関名古屋大学

研究代表者

石川 佳治  名古屋大学, 情報学研究科, 教授 (80263440)

研究分担者 杉浦 健人  名古屋大学, 情報学研究科, 助教 (10821663)
駒水 孝裕  名古屋大学, 数理・データ科学教育研究センター, 准教授 (30756367)
研究期間 (年度) 2024-04-01 – 2026-03-31
研究課題ステータス 交付 (2024年度)
配分額 *注記
17,160千円 (直接経費: 13,200千円、間接経費: 3,960千円)
2025年度: 4,420千円 (直接経費: 3,400千円、間接経費: 1,020千円)
2024年度: 4,550千円 (直接経費: 3,500千円、間接経費: 1,050千円)
2023年度: 4,030千円 (直接経費: 3,100千円、間接経費: 930千円)
2022年度: 4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
キーワード近似的問合せ / 問合せ処理 / データの品質 / 品質保証 / ビッグデータ処理 / データベースシステム / データストリーム / 機械学習
研究開始時の研究の概要

近年大いに着目されている近似的問合せのアプローチをビッグデータ処理のワークフロー全体に展開する,End-to-Endの近似的ビッグデータ処理の技術を確立する.コンパクトな要約情報を活用することと,ビッグデータ処理プロセスを通じて近似的データ処理の統合モデルを用いることで,従来型のビッグデータ処理に比べ大幅な速度向上を達成し,システム全体での近似品質の統一的な管理を可能とする.また,近似の品質と処理効率のトレードオフを適切に制御できることが重要であるため,本研究では求められた近似品質を満たすようにビッグデータ処理のワークフローを制御する品質駆動型の近似的データ処理技術を開発する.

研究実績の概要

本研究は,(A)近似的データ処理の統合モデルの開発,(B)機械学習を導入した近似的データ処理法の開発,(C)ビッグデータ処理システムにおけるEnd-to-End近似処理技術の開発,(D)品質駆動型の近似的データ処理技術の開発,(E)システムプロトタイプの実現と評価,の5つのサブテーマからなる.令和6年度は特に(C)と(D)を中心に研究を進めると予定をしていた.ただし,(A), (B)についても継続した研究の結果,研究の進展があった.
学術雑誌論文として採録された論文のうち2編は(A)および(C)に関わるものであり,大規模なデータベースにおけるデータ要約による問合せ処理の高速化の技術をシステム全体に渡る形で確立した.シノプシスと呼ばれる要約データを作成する技術であるが,本研究の提案はオリジナリティがあり,また,性能が優れていることが評価された.また,(C)および(D)に関する学術雑誌論文として,ストリーム環境においてセンシングなどの入り口から最終的な処理に至るまで,品質を管理しながら近似的にデータの集計等を行う問合せ処理技術を開発した.また,(B)および(D)に関して,機械学習のコア技術である最近傍探索の高速化のため,近似的ではあるが非常に高速である索引および探索技術の開発を行った.この成果は機械学習のトップレベルの会議に採録された.
さらに,(B)に関連するトピックとして,因果推論の技術をデータベースに適用し,データベースに対して背景知識も含めた形でのより精度の高い推論を含むデータベース問合せを実現する手法や,機械学習の手法である多腕バンディット問題のアプローチを近似処理のためのサンプル選択に適用する手法についても研究を進めた.これ以外に,(E)についてはデータベース管理システム(DBMS)の性能を引き出すためのアルゴリズム開発などを進めた.

現在までの達成度
現在までの達成度

2: おおむね順調に進展している

理由

今年度は,近似的問合せ処理に関する基礎技術として開発を進めてきたシノプシス構築およびそれを用いた問合せ手法について学術論文2編の採録に至った.また,近似的ストリーム処理に関しても論文の採録を果たしている.また,近似的最近傍処理に関する論文がトップ会議ICMLに採択された点も評価できると考えられる.本研究のねらいとしていた課題について,論文という形で成果が得られた点は大いに評価できる.また,新しいトピックについての研究の展開も進んでおり,今後の発展も期待できると考えられる.

今後の研究の推進方策

令和7年度は最終年度であることから,研究成果のとりまとめと,サブテーマ(E)で示したプロトタイプシステムの構築に関する取り組みを行う.一方で,因果推論に基づくデータベースに対するより高度な問合せの実現や近似的問合せ処理に対する多腕バンディット問題の活用などの,本研究の過程で出現した新たなトピックについても進展があることから,これらをさらに発展させたいと考えている.
これらの研究を進めることにより生まれた知見をもとに,次年度の科学研究費の獲得のためのテーマ立案を行いたいと考えている.

報告書

(3件)
  • 2024 実施状況報告書
  • 2023 実績報告書
  • 2022 実績報告書
  • 研究成果

    (34件)

すべて 2025 2024 2023 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (5件) (うち査読あり 5件、 オープンアクセス 5件) 学会発表 (28件) (うち国際学会 4件、 招待講演 2件)

  • [国際共同研究] IIIT Delhi(インド)

    • 関連する報告書
      2024 実施状況報告書
  • [雑誌論文] Hierarchical and Efficient Synopsis Construction for Bounded Approximate Query Processing2025

    • 著者名/発表者名
      Ni Tianjia、Sugiura Kento、Ishikawa Yoshiharu、Lu Kejing
    • 雑誌名

      Journal of Information Processing

      巻: 33 号: 0 ページ: 115-127

    • DOI

      10.2197/ipsjjip.33.115

    • ISSN
      1882-6652
    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] エッジコンピューティング環境を想定した近似的な耐障害性保証に基づくウォータマーク制御手法2024

    • 著者名/発表者名
      高尾 大樹、杉浦 健人、石川 佳治、陸 可鏡
    • 雑誌名

      電子情報通信学会論文誌D 情報・システム

      巻: J107-D 号: 5 ページ: 335-347

    • DOI

      10.14923/transinfj.2023DEP0007

    • ISSN
      1880-4535, 1881-0225
    • 年月日
      2024-05-01
    • 関連する報告書
      2024 実施状況報告書 2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Guaranteeing an Exact Error Bound for Bounded Approximate Query Processing2024

    • 著者名/発表者名
      Ni Tianjia、Sugiura Kento、Ishikawa Yoshiharu、Lu Kejing
    • 雑誌名

      Journal of Information Processing

      巻: 32 号: 0 ページ: 903-915

    • DOI

      10.2197/ipsjjip.32.903

    • ISSN
      1882-6652
    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Practical Persistent Multi-word Compare-and-Swap Algorithms for Many-core CPUs2024

    • 著者名/発表者名
      Sugiura Kento、Nishimura Manabu、Ishikawa Yoshiharu
    • 雑誌名

      Journal of Information Processing

      巻: 32 号: 0 ページ: 1003-1012

    • DOI

      10.2197/ipsjjip.32.1003

    • ISSN
      1882-6652
    • 関連する報告書
      2024 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] MQH: Locality Sensitive Hashing on Multi-level Quantization Errors for Point-to-Hyperplane Distances2022

    • 著者名/発表者名
      Kejing Lu, Yoshiharu Ishikawa, Chuan Xiao
    • 雑誌名

      Proceedings of the VLDB Endowment

      巻: 16 号: 4 ページ: 864-876

    • DOI

      10.14778/3574245.3574269

    • 関連する報告書
      2022 実績報告書
    • 査読あり / オープンアクセス
  • [学会発表] データベースにおける来歴情報を考慮した仮説推論問合せのための問合せ言語とその実装2025

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM Forum 2025)
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] 同時実行B+木のマルチバージョン化と範囲走査性能の評価2025

    • 著者名/発表者名
      桑村 真生, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM Forum 2025)
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] ロックフリー索引のトライ木化による改善と評価2025

    • 著者名/発表者名
      井戸 佑, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM Forum 2025)
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] バックオフ戦略によるロックフリーMulti-Word Compare-and-Swap命令の改善2025

    • 著者名/発表者名
      吽野 元基, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会第87回全国大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] 楽観的ロック手法OptiQLの再現実装及び性能評価2025

    • 著者名/発表者名
      阿井 星后, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会第87回全国大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] 多腕バンディットを利用した自動索引作成の再現実装及び性能評価2025

    • 著者名/発表者名
      張 智嘉, 郭 宏遠, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会第87回全国大会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] 劔"Tsurugi"とは:データベースシステム技術の変遷と研究のトレンド2025

    • 著者名/発表者名
      石川 佳治
    • 学会等名
      情報処理学会第87回全国大会
    • 関連する報告書
      2024 実施状況報告書
    • 招待講演
  • [学会発表] Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search2024

    • 著者名/発表者名
      Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa
    • 学会等名
      International Conference on Machine Learning (ICML)
    • 関連する報告書
      2024 実施状況報告書
    • 国際学会
  • [学会発表] Acceleration of Synopsis Construction for Bounded Approximate Query Processing2024

    • 著者名/発表者名
      Tianjia Ni, Kento Sugiura, Yoshiharu Ishikawa, Kejing Lu
    • 学会等名
      The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024), DASFAA 2024 Workshops
    • 関連する報告書
      2024 実施状況報告書
    • 国際学会
  • [学会発表] 同時実行B+木のマルチバージョン化とその性能評価2024

    • 著者名/発表者名
      桑村 真生, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      xSIG
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] ロックフリー索引のトライ木化による高速化に関する研究2024

    • 著者名/発表者名
      井戸 佑, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会データベースシステム研究会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] データベースにおける仮説推論問合せについて2024

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      情報処理学会データベースシステム研究会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] マルチバージョン同時実行B+木の範囲走査性能の評価2024

    • 著者名/発表者名
      桑村 真生, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会データベースシステム研究会
    • 関連する報告書
      2024 実施状況報告書
  • [学会発表] Acceleration of Synopsis Construction for Approximate Query Processing2024

    • 著者名/発表者名
      Tianjia Ni, Kento Sugiura, Yoshiharu Ishikawa, Kejing Lu
    • 学会等名
      The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024)
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] Probabilistic Routing for Graph-Based Approximate Nearest Neighbor Search2024

    • 著者名/発表者名
      Kejing Lu, Chuan Xiao, Yoshiharu Ishikawa
    • 学会等名
      International Conference on Machine Learning
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] 誤差保証付き近似的問合せ処理におけるシノプシス構築の高速化2024

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 来歴情報を活用したデータベースからの因果推論2024

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム(DEIM 2024)
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 因果推論に基づくデータベースからの仮説問合せについて2024

    • 著者名/発表者名
      大岩 和樹, 石川 佳治, 杉浦 健人, 陸 可鏡
    • 学会等名
      情報処理学会第86回全国大会
    • 関連する報告書
      2023 実績報告書
  • [学会発表] 誤差上限付き近似問合せ処理におけるシノプシス構築の高速化2023

    • 著者名/発表者名
      堀崎 祥, 倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      情報処理学会第85回全国大会
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 近似的問合せ処理におけるシノプシス構築の高速化2023

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習によるグラフベース近似最近傍探索の高速化2023

    • 著者名/発表者名
      菅 寧, 陸 可鏡, 杉浦 健人, 石川 佳治
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] エッジコンピューティング環境を想定した近似的な耐障害性保証に基づくデータストリーム処理システム2023

    • 著者名/発表者名
      高尾 大樹, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム(DEIM 2023)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] Approximate Database Query Processing with Error Guarantees2023

    • 著者名/発表者名
      Yoshiharu Ishikawa
    • 学会等名
      International Conference on Ubiquitous Information Management and Communication (IMCOM 2023)
    • 関連する報告書
      2022 実績報告書
    • 招待講演
  • [学会発表] 近似的問合せ処理における問合せ高速化のための誤差保証条件の検討2022

    • 著者名/発表者名
      倪 天嘉, 杉浦 健人, 石川 佳治, 陸 可鏡
    • 学会等名
      WebDB夏のワークショップ2022, 情報処理学会研究報告データベースシステム (DBS)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習を用いた検索エッジ数の推定によるグラフベース近似最近傍探索の高速化2022

    • 著者名/発表者名
      菅 寧, 陸 可鏡, 石川 佳治, 杉浦 健人
    • 学会等名
      第21回情報科学技術フォーラム (FIT 2022)
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 近似的な耐障害性保証に基づくエッジストリーム処理システムの開発2022

    • 著者名/発表者名
      高尾 大樹
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 問合せ処理の高速化に基づくシノプシスの誤差保証条件について2022

    • 著者名/発表者名
      倪 天嘉
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書
  • [学会発表] 機械学習を用いた検索エッジ数の推定によるグラフベース近似最近傍探索の高速化2022

    • 著者名/発表者名
      菅 寧
    • 学会等名
      東海関西データベースワークショップ2022
    • 関連する報告書
      2022 実績報告書

URL: 

公開日: 2022-04-19   更新日: 2025-12-26  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi