• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

Fast Query Processing for Large Scientific Databases

Research Project

Project/Area Number 22K17894
Research Category

Grant-in-Aid for Early-Career Scientists

Allocation TypeMulti-year Fund
Review Section Basic Section 60080:Database-related
Research InstitutionUniversity of Tsukuba

Principal Investigator

塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)

Project Period (FY) 2022-04-01 – 2026-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,680,000 (Direct Cost: ¥3,600,000、Indirect Cost: ¥1,080,000)
Fiscal Year 2025: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥780,000 (Direct Cost: ¥600,000、Indirect Cost: ¥180,000)
Keywordsグラフデータベース / 問合せ処理 / 文字列データベース / データベース / ビッグデータ
Outline of Research at the Start

生命科学や医療科学などの研究分野では,大量のデータを活用したデータ駆動型科学へと研究がパラダイムシフトしつつある.本研究は科学データ処理の中でも最も基本的な問合せ処理を対象とした超高速なアルゴリズムの実現を目的として,科学データのもつ特性を活用した効率的なデータ圧縮手法とそれに基づく問合せ処理手法の構築を目標とする.本研究は新たな問合せ処理の計算方式を開拓するとともにその理論的限界を追求する.また,研究成果をソフトウェアとして公開しつつ,医療や科学データ分析などの実応用分野におけるケーススタディを実施することで開発技術の普及とさらなる発展を目指す.

Outline of Annual Research Achievements

本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合を対象として,モチーフ構造に基づいた高速な問合せ処理手法の開発に取り組んだ.前年度に開発したデータ圧縮技術を要素技術として,それぞれの対象の計算空間を削減し,問合せ処理の高速化を実現した.具体的な各取り組みと研究成果について以下に記載する.
(1)本項目では前年度に引き続きタンパク質DBをプロパティグラフ集合とみなし,データ要約に基づく高速な類似問合せ処理手法の開発を行った.本手法は前年度開発したデータ圧縮手法を活用してタンパク質DBの頻出構造を捉えた簡潔な構造へとDBを要約する.これにより,提案手法が探索するグラフのサイズは従来手法よりも抑制され,結果として高速な問合せ処理を可能とした.さらに本年度はケーススタディとして,この手法をAI創薬における要素技術であるLBVSに応用・ライブラリ化し,構造活性相関を持つタンパク質を高速に検索するアルゴリズムも開発した.本成果は国際会議にて発表を行った.
(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを対象とした高速な類似問合せ処理手法の開発を行った.特に本年度は,DNAシーケンスDBからクエリと正の相関関係にある部分シーケンスを高速に検索するためのアルゴリズムの開発に取り組んだ.提案手法は前年度開発したデータ圧縮方式に基づいて(1)と同様にデータ要約を行いつつ,正の相関を持ち得ない部分シーケンスを探索の枝刈りを行う.これにより,従来手法と比較して最大1,000倍程度高速な検索を実現した.また,本研究では提案手法が出力する問合せ処理結果は全件検索を行ったベースライン手法と同一のものとなることを理論的に保証している.本研究の成果は国際会議にて発表を行った.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

本研究課題の現在の進捗状況は当初の計画以上に進展していると評価している.本年度の計画はプロパティグラフ集合ならびに文字列シーケンス集合を対象として,モチーフ構造に基づいたデータ要約を活用した高速な問合せ処理手法を開発することである.これに対して,上述したとおり,本年度はプロパティグラフ集合や文字列シーケンス集合に対する高速な問合せ処理アルゴリズムを実現するだけでなく,一部の成果については実際の科学データ分析を対象としたケーススタディの実施やライブラリ開発にまで研究が進捗している.ケーススタディ・ライブラリ開発については,当初計画では2024年度に取り組む予定の課題であったが,現時点で国際会議での成果発表を行う段階にまで到達している状況である.以上のことより,本研究課題は現時点において当初の計画以上に進展していると考える.

Strategy for Future Research Activity

上述したとおり,本研究は当初の計画以上に進展している.そのため,2024年度は引き続き当初の計画に基づいて問合せ処理の高速化を活用したケーススタディやライブラリ構築に取り組むとともに,2025年度を中心に取り組む計画であった(1)半構造データのデータ要約・データ圧縮技術の開拓,(2)半構造データに対する高速な問合せ処理手法の開発に着手する予定である.

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (32 results)

All 2024 2023 2022 Other

All Int'l Joint Research (1 results) Journal Article (9 results) (of which Peer Reviewed: 9 results,  Open Access: 3 results) Presentation (22 results) (of which Int'l Joint Research: 5 results,  Invited: 3 results)

  • [Int'l Joint Research] Eindhoven University of Technology(オランダ)

    • Related Report
      2023 Research-status Report
  • [Journal Article] Wedge-Based Graph Summarization for Large-Scale Graph2023

    • Author(s)
      真次 彰平、塩川 浩昭
    • Journal Title

      電子情報通信学会論文誌D 情報・システム

      Volume: J106-D Issue: 10 Pages: 459-469

    • DOI

      10.14923/transinfj.2022JDT0003

    • ISSN
      1880-4535, 1881-0225
    • Year and Date
      2023-10-01
    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] An Effective Graph-based Music Recommendation Algorithm for Automatic Playlist Continuation2023

    • Author(s)
      Toshi-Hiro Ito, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 2023 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM2023)

      Volume: - Pages: 459-463

    • DOI

      10.1145/3625007.3627322

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Maximum k-plex Search via Selective Branch-and-Bound2023

    • Author(s)
      Shohei Matsugu, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 348-357

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Boosting Similar Compounds Searches via Correlated Subgraph Analysis2023

    • Author(s)
      Yuma Naoi, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 464-477

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Fast Correlated DNA Subsequence Search via Graph-based Representation2023

    • Author(s)
      Ryuichi Yagi, Yuma Naoi, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 339-347

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Efficient Similarity Searches for Multivariate Time Series: A Hash-based Approach2023

    • Author(s)
      Yuma Yasuda, Hiroaki Shiokawa
    • Journal Title

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      Volume: - Pages: 478-490

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Indexing complex networks for fast attributed kNN queries2022

    • Author(s)
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • Journal Title

      Social Network Analysis and Mining

      Volume: 12 Issue: 1

    • DOI

      10.1007/s13278-022-00904-w

    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Tree-Based Graph Indexing for Fast kNN Queries2022

    • Author(s)
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • Journal Title

      Information Integration and Web Intelligence

      Volume: - Pages: 195-207

    • DOI

      10.1007/978-3-031-21047-1_18

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Fast Top-k Similar Sequence Search on DNA Databases2022

    • Author(s)
      Yagi Ryuichi、Shiokawa Hiroaki
    • Journal Title

      Information Integration and Web Intelligence

      Volume: - Pages: 145-150

    • DOI

      10.1007/978-3-031-21047-1_14

    • ISBN
      9783031210464, 9783031210471
    • Related Report
      2022 Research-status Report
    • Peer Reviewed / Open Access
  • [Presentation] プロパティグラフに対するDISTINCT句を含む問合せ処理の高速化2024

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      情報処理学会 第86回全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] 空間索引を用いたS-FINCHの高速化2024

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      情報処理学会 第86回全国大会
    • Related Report
      2023 Research-status Report
  • [Presentation] プリミティブなグラフ分析アルゴリズムに対する効率的なグラフ要約の応用2024

    • Author(s)
      真次 彰平, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024),
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフ要約を用いた高速なグラフ相関問合せ2024

    • Author(s)
      直井 悠馬, 塩川 浩昭, 真次 彰平
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模DNAデータベースに対するTop-k相関問合せ手法の提案2024

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024
    • Related Report
      2023 Research-status Report
  • [Presentation] クエリ長に依存しない多次元時系列データに対する類似問合せ手法の提案2024

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフデータベースにおけるWorst-case Optimal Joinの最適化2024

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模データストリームに対する高速なS-FINCHクラスタリング2024

    • Author(s)
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • Organizer
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • Related Report
      2023 Research-status Report
  • [Presentation] Massive Graph Analysis at Scale2023

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      The 18th Korea-Japan (Japan-Korea) Database Workshop (KJDB 2023)
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] 化合物グラフデータベースに対する高速・高精度な類似検索手法の提案2023

    • Author(s)
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(7)
    • Related Report
      2023 Research-status Report
  • [Presentation] 大規模DNAデータベースに対する高速な相関問合せ手法の提案2023

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • Related Report
      2023 Research-status Report
  • [Presentation] プレイリストの自動継続機能に対するグラフに基づいた楽曲推薦アルゴリズムの提案2023

    • Author(s)
      伊藤 寿浩, 塩川 浩昭
    • Organizer
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • Related Report
      2023 Research-status Report
  • [Presentation] グラフ集約に基づく高速な最大k-plex探索2023

    • Author(s)
      真次 彰平, 藤原 靖宏, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 動的グラフにおけるk最近傍探索のための索引更新手法の提案2023

    • Author(s)
      小林 瑞季, 真次 彰平, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] グラフデータベースに対する高速高精度な相関問合せ2023

    • Author(s)
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] DNAデータベースに対する効率的な相関問合せ手法の提案2023

    • Author(s)
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 多次元時系列データに対する類似部分シーケンス問合せの高速化2023

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      第15回データ工学と情報マネジメントに関するフォーラム
    • Related Report
      2022 Research-status Report
  • [Presentation] 多次元時系列データに対する高速なモチーフ問合せ手法の提案2023

    • Author(s)
      安田 裕真, 塩川 浩昭
    • Organizer
      情報処理学会 第85回全国大会
    • Related Report
      2022 Research-status Report
  • [Presentation] Tree-Based Graph Indexing for Fast kNN Queries2022

    • Author(s)
      Suomi Kobayashi, Shohei Matsugu, Hiroaki Shiokawa
    • Organizer
      The 24th International Conference on Information Integration and Web Intelligence
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Fast Top-k Similar Sequence Search on DNA Databases2022

    • Author(s)
      Ryuichi Yagi, Hiroaki Shiokawa
    • Organizer
      The 24th International Conference on Information Integration and Web Intelligence
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research
  • [Presentation] Fast Similarity Search for Large Knowledge Graphs2022

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      Aarhus Workshop on Graph Access and Analysis
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research / Invited
  • [Presentation] Graph-based Clustering at Scale2022

    • Author(s)
      Hiroaki Shiokawa
    • Organizer
      Aarhus Workshop on Graph Access and Analysis
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research / Invited

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi