• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Fast Query Processing for Large Scientific Databases

Research Project

Project/Area Number 22K17894
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60080:Database-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)

Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2024)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywordsデータベース / 問合せ処理 / データ要約 / 半構造データ / グラフデータ / グラフデータベース / 文字列データベース / ビッグデータ
Outline of Research at the Start

生命科学や医療科学などの研究分野では,大量のデータを活用したデータ駆動型科学へと研究がパラダイムシフトしつつある.本研究は科学データ処理の中でも最も基本的な問合せ処理を対象とした超高速なアルゴリズムの実現を目的として,科学データのもつ特性を活用した効率的なデータ圧縮手法とそれに基づく問合せ処理手法の構築を目標とする.本研究は新たな問合せ処理の計算方式を開拓するとともにその理論的限界を追求する.また,研究成果をソフトウェアとして公開しつつ,医療や科学データ分析などの実応用分野におけるケーススタディを実施することで開発技術の普及とさらなる発展を目指す.

Outline of Annual Research Achievements

本年度は計画に基づき,(1)半構造データのデータ要約・データ圧縮技術の開拓,(2)半構造データに対する高速な問合せ処理手法の開発に取り組んだ.前年度に開発したモチーフに基づいた高速な問合せ処理手法を半構造データ処理に対して応用することで省メモリかつ効率的な問合せ処理技術を実現した.具体的な各取り組みと研究成果について以下に記載する.
(1)本項目では,大規模な半構造データに対し,データ要約を活用したプリミティブなデータ処理を効率化する手法を開発した.具体的には,前年度までに開発したデータ要約法HYBRIDに基づき,頻出要素の数え上げおよび類似性探索といったプリミティブな処理を要約データ上で高速に行うアルゴリズムを開発した.ウェッジ分割とBLEWと呼ばれるビット列表現を用いることで,元のデータを展開することなく正確に処理を行えるのが特徴である.本研究の成果は学術雑誌論文にて発表を行った.
(2)本項目では,半構造データベースにおけるパターンマッチ問合せ処理において,特にDISTINCT句を含む問合せの高速化手法を開発した.従来手法は重複排除が必要なDISTINCT句を含む場合に多くの冗長な計算が発生する.提案手法では,問合せ結果に不要な探索の打ち切りと,モチーフに基づく探索順序の最適化を導入することで,問合せ処理の効率を大幅に改善した.大規模な実データに基づく評価では,既存手法に対し平均121倍の高速化,選択率の高いクエリでは最大約200倍の高速化を達成しており,実行計画と探索制御の工夫が有効であることを実証した.本研究の成果は学術雑誌論文にて発表を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本研究課題の進捗状況は,当初の計画を上回る水準に達していると評価できる.令和6(2024)年度の当初計画では,プロパティグラフ集合および文字列シーケンス集合を対象として,ケーススタディの実施およびライブラリの開発を主要な活動内容として設定していた.これらの成果については令和5(2023)年度末までに既に一定の達成を見ており,本年度は,当初は令和7(2025)年度に着手予定であった半構造データ処理に関する研究課題に先行して取り組んでいる.また,本研究課題の一部成果については,既に学術雑誌論文として公表しており,これは令和7年度末における目標成果として設定していた水準に相当するものである.以上のことから,現時点において本研究課題は,当初の計画を超える進展を遂げていると考えられる.

Strategy for Future Research Activity

上述したとおり,本研究は当初の計画以上に進展している.そのため,2025年度は引き続き当初の計画に基づいて問合せ処理の高速化を活用したケーススタディやライブラリ構築に取り組む予定である.

Report

(3 results)
  • 2024 Research-status Report
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (51 results)

All 2025 2024 2023 2022 Other

All Int'l Joint Research (1 results) Journal Article (14 results) (of which Peer Reviewed: 14 results,  Open Access: 3 results) Presentation (36 results) (of which Int'l Joint Research: 7 results,  Invited: 4 results)

  • [Int'l Joint Research] Eindhoven University of Technology(オランダ)

    • Related Report
      2023 Research-status Report
  • [Journal Article] Efficient Primitive Graph Algorithms via Graph Summarization2025

    • Author(s)
      真次 彰平、塩川 浩昭
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J108-D Issue: 5 Pages: 239-250

    • DOI

      10.14923/transinfj.2024DET0004

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2025-05-01
    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Correlated Sequence Queries for Large-scale DNA Databases2025

    • Author(s)
      八木 隆一、直井 悠馬、塩川 浩昭
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J108-D Issue: 5 Pages: 298-306

    • DOI

      10.14923/transinfj.2024DET0009

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2025-05-01
    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Fast Algorithm for Graph Pattern Matching Queries with DISTINCT Clause2025

    • Author(s)
      伊藤 寿浩、塩川 浩昭
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J108-D Issue: 5 Pages: 251-259

    • DOI

      10.14923/transinfj.2024DET0005

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2025-05-01
    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] An Efficient Indexing Method for Dynamic Graph kNN2024

    • Author(s)
      Matsugu Shohei、Kobayashi Suomi、Shiokawa Hiroaki
    • Journal Title

      Proceedings of the 35th International Conference on Database and Expert Systems Applications (DEXA2024)

      Volume: - Pages: 81-89

    • DOI

      10.1007/978-3-031-68309-1_7

    • ISBN
      9783031683084, 9783031683091
    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Correlated Subgraph Searches for AI-powered Drug Discovery2024

    • Author(s)
      Shiokawa Hiroaki、Naoi Yuma、Matsugu Shohei
    • Journal Title

      Proceedings of the 33rd International Joint Conference on Artificial Intelligence (IJCAI2024)

      Volume: - Pages: 2351-2361

    • DOI

      10.24963/ijcai.2024/260

    • Related Report
      2024 Research-status Report
    • Peer Reviewed
  • [Journal Article] Wedge-Based Graph Summarization for Large-Scale Graph2023

    • Author(s)
      真次 彰平、塩川 浩昭
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J106-D Issue: 10 Pages: 459-469

    • DOI

      10.14923/transinfj.2022JDT0003

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2023-10-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] An Effective Graph-based Music Recommendation Algorithm for Automatic Playlist Continuation2023

    • Author(s)
      Toshi-Hiro Ito, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 2023 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM2023)

      Volume: - Pages: 459-463

    • DOI

      10.1145/3625007.3627322

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Maximum k-plex Search via Selective Branch-and-Bound2023

    • Author(s)
      Shohei Matsugu, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 348-357

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Boosting Similar Compounds Searches via Correlated Subgraph Analysis2023

    • Author(s)
      Yuma Naoi, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 464-477

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Fast Correlated DNA Subsequence Search via Graph-based Representation2023

    • Author(s)
      Ryuichi Yagi, Yuma Naoi, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 339-347

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Similarity Searches for Multivariate Time Series: A Hash-based Approach2023

    • Author(s)
      Yuma Yasuda, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 478-490

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Indexing complex networks for fast attributed kNN queries2022

    • Author(s)
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • Journal Title

      Social Network Analysis and Mining

      Volume: 12 Issue: 1

    • DOI

      10.1007/s13278-022-00904-w

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Tree-Based Graph Indexing for Fast kNN Queries2022

    • Author(s)
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • Journal Title

      Information Integration and Web Intelligence

      Volume: - Pages: 195-207

    • DOI

      10.1007/978-3-031-21047-1_18

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Fast Top-k Similar Sequence Search on DNA Databases2022

    • Author(s)
      Yagi Ryuichi、Shiokawa Hiroaki
    • Journal Title

      Information Integration and Web Intelligence

      Volume: - Pages: 145-150

    • DOI

      10.1007/978-3-031-21047-1_14

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] 化合物データベースに対する範囲検索の高速化2025

    • Author(s)
      尾名高 祐斗, 牛尼 索造, 塩川 浩昭
    • Organizer
      情報処理学会 第87回全国大会
    • Related Report
      2024 Research-status Report
  • [Presentation] 正解スキーマを必要としないプロパティグラフのスキーマ評価手法の提案2025

    • Author(s)
      湯川 楓祐, 塩川 浩昭
    • Organizer
      情報処理学会 第87回全国大会
    • Related Report
      2024 Research-status Report
  • [Presentation] 次元削減を用いた高次元データに対するS-FINCHの高速化2025

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM 2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] 集約隣接リストを用いたWorst-Case Optimal Join の高速化2025

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM 2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] プロパティグラフに対する新たなスキーマ評価指標の提案2025

    • Author(s)
      湯川 楓祐, 塩川 浩昭
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM 2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] 化合物データベースに対する高速な範囲検索アルゴリズム2025

    • Author(s)
      尾名高 祐斗, 牛尼 索造, 塩川 浩昭
    • Organizer
      第17回データ工学と情報マネジメントに関するフォーラム (DEIM 2025)
    • Related Report
      2024 Research-status Report
  • [Presentation] An Efficient Indexing Method for Dynamic Graph kNN2024

    • Author(s)
      Shohei Matsugu, Suomi Kobayashi, Hiroaki Shiokawa
    • Organizer
      the 35th International Conference on Database and Expert Systems Applications (DEXA2024)
    • Related Report
      2024 Research-status Report
    • Int'l Joint Research
  • [Presentation] Efficient Correlated Subgraph Searches for AI-powered Drug Discovery2024

    • Author(s)
      Hiroaki Shiokawa, Yuma Naoi, Shohei Matsugu
    • Organizer
      the 33rd International Joint Conference on Artificial Intelligence (IJCAI2024)
    • Related Report
      2024 Research-status Report
    • Int'l Joint Research
  • [Presentation] 基調構造に基づいた大規模グラフ処理の超高速化とその応用2024

    • Author(s)
      塩川 浩昭
    • Organizer
      電子情報通信学会 コミュニケーションクオリティ (CQ) 研究会
    • Related Report
      2024 Research-status Report
    • Invited
  • [Presentation] 階層SAXを用いた時系列データに対する類似問合せの高速化2024

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS)
    • Related Report
      2024 Research-status Report
  • [Presentation] ビットセットを用いたWorst-Case Optimal Joinの高速化2024

    • Author(s)
      伊藤 寿浩, 牛尼 索造, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS)
    • Related Report
      2024 Research-status Report
  • [Presentation] 高速なS-FINCHのためのデータストリームに対する最近傍・逆最近傍索引構築2024

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS)
    • Related Report
      2024 Research-status Report
  • [Presentation] LSH Forest を利用した類似化合物検索の性能評価2024

    • Author(s)
      尾名高 祐斗, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS)
    • Related Report
      2024 Research-status Report
  • [Presentation] グラフデータベースにおけるスキーマ抽出手法の性能評価2024

    • Author(s)
      湯川 楓祐, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS)
    • Related Report
      2024 Research-status Report
  • [Presentation] プロパティグラフに対するDISTINCT句を含む問合せ処理の高速化2024

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      情報処理学会 第86回全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 空間索引を用いたS-FINCHの高速化2024

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      情報処理学会 第86回全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] プリミティブなグラフ分析アルゴリズムに対する効率的なグラフ要約の応用2024

    • Author(s)
      真次 彰平, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024),
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフ要約を用いた高速なグラフ相関問合せ2024

    • Author(s)
      直井 悠馬, 塩川 浩昭, 真次 彰平
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模DNAデータベースに対するTop-k相関問合せ手法の提案2024

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024
    • Related Report
      2023 Research-status Report
  • [Presentation] クエリ長に依存しない多次元時系列データに対する類似問合せ手法の提案2024

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフデータベースにおけるWorst-case Optimal Joinの最適化2024

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模データストリームに対する高速なS-FINCHクラスタリング2024

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] Massive Graph Analysis at Scale2023

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      The 18th Korea-Japan (Japan-Korea) Database Workshop (KJDB 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] 化合物グラフデータベースに対する高速・高精度な類似検索手法の提案2023

    • Author(s)
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(7)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模DNAデータベースに対する高速な相関問合せ手法の提案2023

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • Related Report
      2023 Research-status Report
  • [Presentation] プレイリストの自動継続機能に対するグラフに基づいた楽曲推薦アルゴリズムの提案2023

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフ集約に基づく高速な最大k-plex探索2023

    • Author(s)
      真次 彰平, 藤原 靖宏, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 動的グラフにおけるk最近傍探索のための索引更新手法の提案2023

    • Author(s)
      小林 瑞季, 真次 彰平, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] グラフデータベースに対する高速高精度な相関問合せ2023

    • Author(s)
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] DNAデータベースに対する効率的な相関問合せ手法の提案2023

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 多次元時系列データに対する類似部分シーケンス問合せの高速化2023

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 多次元時系列データに対する高速なモチーフ問合せ手法の提案2023

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      情報処理学会 第85回全国大会
    • Related Report
      2022 Research-status Report
  • [Presentation] Tree-Based Graph Indexing for Fast kNN Queries2022

    • Author(s)
      Suomi Kobayashi, Shohei Matsugu, Hiroaki Shiokawa
    • Organizer
      The 24th International Conference on Information Integration and Web Intelligence
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Fast Top-k Similar Sequence Search on DNA Databases2022

    • Author(s)
      Ryuichi Yagi, Hiroaki Shiokawa
    • Organizer
      The 24th International Conference on Information Integration and Web Intelligence
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Fast Similarity Search for Large Knowledge Graphs2022

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      Aarhus Workshop on Graph Access and Analysis
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Graph-based Clustering at Scale2022

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      Aarhus Workshop on Graph Access and Analysis
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research / Invited

URL: 

Published: 2022-04-19   Modified: 2025-12-26  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi