• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

大規模科学データに対する高速問合せ処理

研究課題

研究課題/領域番号 22K17894
研究種目

若手研究

配分区分基金
審査区分 小区分60080:データベース関連
研究機関筑波大学

研究代表者

塩川 浩昭  筑波大学, 計算科学研究センター, 准教授 (90775248)

研究期間 (年度) 2022-04-01 – 2026-03-31
研究課題ステータス 交付 (2023年度)
配分額 *注記
4,680千円 (直接経費: 3,600千円、間接経費: 1,080千円)
2025年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2024年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2023年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2022年度: 780千円 (直接経費: 600千円、間接経費: 180千円)
キーワードグラフデータベース / 問合せ処理 / 文字列データベース / データベース / ビッグデータ
研究開始時の研究の概要

生命科学や医療科学などの研究分野では,大量のデータを活用したデータ駆動型科学へと研究がパラダイムシフトしつつある.本研究は科学データ処理の中でも最も基本的な問合せ処理を対象とした超高速なアルゴリズムの実現を目的として,科学データのもつ特性を活用した効率的なデータ圧縮手法とそれに基づく問合せ処理手法の構築を目標とする.本研究は新たな問合せ処理の計算方式を開拓するとともにその理論的限界を追求する.また,研究成果をソフトウェアとして公開しつつ,医療や科学データ分析などの実応用分野におけるケーススタディを実施することで開発技術の普及とさらなる発展を目指す.

研究実績の概要

本年度は研究計画に基づき,(1)プロパティグラフ集合ならびに(2)文字列シーケンス集合を対象として,モチーフ構造に基づいた高速な問合せ処理手法の開発に取り組んだ.前年度に開発したデータ圧縮技術を要素技術として,それぞれの対象の計算空間を削減し,問合せ処理の高速化を実現した.具体的な各取り組みと研究成果について以下に記載する.
(1)本項目では前年度に引き続きタンパク質DBをプロパティグラフ集合とみなし,データ要約に基づく高速な類似問合せ処理手法の開発を行った.本手法は前年度開発したデータ圧縮手法を活用してタンパク質DBの頻出構造を捉えた簡潔な構造へとDBを要約する.これにより,提案手法が探索するグラフのサイズは従来手法よりも抑制され,結果として高速な問合せ処理を可能とした.さらに本年度はケーススタディとして,この手法をAI創薬における要素技術であるLBVSに応用・ライブラリ化し,構造活性相関を持つタンパク質を高速に検索するアルゴリズムも開発した.本成果は国際会議にて発表を行った.
(2)本項目ではDNAシーケンサを用いて獲得したDNAシーケンスDBを対象とした高速な類似問合せ処理手法の開発を行った.特に本年度は,DNAシーケンスDBからクエリと正の相関関係にある部分シーケンスを高速に検索するためのアルゴリズムの開発に取り組んだ.提案手法は前年度開発したデータ圧縮方式に基づいて(1)と同様にデータ要約を行いつつ,正の相関を持ち得ない部分シーケンスを探索の枝刈りを行う.これにより,従来手法と比較して最大1,000倍程度高速な検索を実現した.また,本研究では提案手法が出力する問合せ処理結果は全件検索を行ったベースライン手法と同一のものとなることを理論的に保証している.本研究の成果は国際会議にて発表を行った.

現在までの達成度 (区分)
現在までの達成度 (区分)

1: 当初の計画以上に進展している

理由

本研究課題の現在の進捗状況は当初の計画以上に進展していると評価している.本年度の計画はプロパティグラフ集合ならびに文字列シーケンス集合を対象として,モチーフ構造に基づいたデータ要約を活用した高速な問合せ処理手法を開発することである.これに対して,上述したとおり,本年度はプロパティグラフ集合や文字列シーケンス集合に対する高速な問合せ処理アルゴリズムを実現するだけでなく,一部の成果については実際の科学データ分析を対象としたケーススタディの実施やライブラリ開発にまで研究が進捗している.ケーススタディ・ライブラリ開発については,当初計画では2024年度に取り組む予定の課題であったが,現時点で国際会議での成果発表を行う段階にまで到達している状況である.以上のことより,本研究課題は現時点において当初の計画以上に進展していると考える.

今後の研究の推進方策

上述したとおり,本研究は当初の計画以上に進展している.そのため,2024年度は引き続き当初の計画に基づいて問合せ処理の高速化を活用したケーススタディやライブラリ構築に取り組むとともに,2025年度を中心に取り組む計画であった(1)半構造データのデータ要約・データ圧縮技術の開拓,(2)半構造データに対する高速な問合せ処理手法の開発に着手する予定である.

報告書

(2件)
  • 2023 実施状況報告書
  • 2022 実施状況報告書
  • 研究成果

    (32件)

すべて 2024 2023 2022 その他

すべて 国際共同研究 (1件) 雑誌論文 (9件) (うち査読あり 9件、 オープンアクセス 3件) 学会発表 (22件) (うち国際学会 5件、 招待講演 3件)

  • [国際共同研究] Eindhoven University of Technology(オランダ)

    • 関連する報告書
      2023 実施状況報告書
  • [雑誌論文] ウェッジ分割を用いた大規模グラフの要約手法2023

    • 著者名/発表者名
      真次 彰平、塩川 浩昭
    • 雑誌名

      電子情報通信学会論文誌D 情報・システム

      巻: J106-D 号: 10 ページ: 459-469

    • DOI

      10.14923/transinfj.2022JDT0003

    • ISSN
      1880-4535, 1881-0225
    • 年月日
      2023-10-01
    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] An Effective Graph-based Music Recommendation Algorithm for Automatic Playlist Continuation2023

    • 著者名/発表者名
      Toshi-Hiro Ito, Hiroaki Shiokawa
    • 雑誌名

      In Proceedings of the 2023 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining (ASONAM2023)

      巻: - ページ: 459-463

    • DOI

      10.1145/3625007.3627322

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Efficient Maximum k-plex Search via Selective Branch-and-Bound2023

    • 著者名/発表者名
      Shohei Matsugu, Hiroaki Shiokawa
    • 雑誌名

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      巻: - ページ: 348-357

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Boosting Similar Compounds Searches via Correlated Subgraph Analysis2023

    • 著者名/発表者名
      Yuma Naoi, Hiroaki Shiokawa
    • 雑誌名

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      巻: - ページ: 464-477

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Fast Correlated DNA Subsequence Search via Graph-based Representation2023

    • 著者名/発表者名
      Ryuichi Yagi, Yuma Naoi, Hiroaki Shiokawa
    • 雑誌名

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      巻: - ページ: 339-347

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Efficient Similarity Searches for Multivariate Time Series: A Hash-based Approach2023

    • 著者名/発表者名
      Yuma Yasuda, Hiroaki Shiokawa
    • 雑誌名

      In Proceedings of the 25th International Conference on Information Integration and Web Intelligence (iiWAS2023)

      巻: - ページ: 478-490

    • 関連する報告書
      2023 実施状況報告書
    • 査読あり
  • [雑誌論文] Indexing complex networks for fast attributed kNN queries2022

    • 著者名/発表者名
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • 雑誌名

      Social Network Analysis and Mining

      巻: 12 号: 1

    • DOI

      10.1007/s13278-022-00904-w

    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Tree-Based Graph Indexing for Fast kNN Queries2022

    • 著者名/発表者名
      Kobayashi Suomi、Matsugu Shohei、Shiokawa Hiroaki
    • 雑誌名

      Information Integration and Web Intelligence

      巻: - ページ: 195-207

    • DOI

      10.1007/978-3-031-21047-1_18

    • ISBN
      9783031210464, 9783031210471
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Fast Top-k Similar Sequence Search on DNA Databases2022

    • 著者名/発表者名
      Yagi Ryuichi、Shiokawa Hiroaki
    • 雑誌名

      Information Integration and Web Intelligence

      巻: - ページ: 145-150

    • DOI

      10.1007/978-3-031-21047-1_14

    • ISBN
      9783031210464, 9783031210471
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [学会発表] プロパティグラフに対するDISTINCT句を含む問合せ処理の高速化2024

    • 著者名/発表者名
      伊藤 寿浩, 塩川 浩昭
    • 学会等名
      情報処理学会 第86回全国大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 空間索引を用いたS-FINCHの高速化2024

    • 著者名/発表者名
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • 学会等名
      情報処理学会 第86回全国大会
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] プリミティブなグラフ分析アルゴリズムに対する効率的なグラフ要約の応用2024

    • 著者名/発表者名
      真次 彰平, 塩川 浩昭
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024),
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] グラフ要約を用いた高速なグラフ相関問合せ2024

    • 著者名/発表者名
      直井 悠馬, 塩川 浩昭, 真次 彰平
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 大規模DNAデータベースに対するTop-k相関問合せ手法の提案2024

    • 著者名/発表者名
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] クエリ長に依存しない多次元時系列データに対する類似問合せ手法の提案2024

    • 著者名/発表者名
      安田 裕真, 塩川 浩昭
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] グラフデータベースにおけるWorst-case Optimal Joinの最適化2024

    • 著者名/発表者名
      伊藤 寿浩, 塩川 浩昭
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 大規模データストリームに対する高速なS-FINCHクラスタリング2024

    • 著者名/発表者名
      牛尼 索造, 藤原 靖宏, 塩川 浩昭
    • 学会等名
      第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] Massive Graph Analysis at Scale2023

    • 著者名/発表者名
      Hiroaki Shiokawa
    • 学会等名
      The 18th Korea-Japan (Japan-Korea) Database Workshop (KJDB 2023)
    • 関連する報告書
      2023 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] 化合物グラフデータベースに対する高速・高精度な類似検索手法の提案2023

    • 著者名/発表者名
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • 学会等名
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(7)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] 大規模DNAデータベースに対する高速な相関問合せ手法の提案2023

    • 著者名/発表者名
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • 学会等名
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] プレイリストの自動継続機能に対するグラフに基づいた楽曲推薦アルゴリズムの提案2023

    • 著者名/発表者名
      伊藤 寿浩, 塩川 浩昭
    • 学会等名
      情報処理学会 研究報告データベースシステム (DBS), 2023-DBS-177(9)
    • 関連する報告書
      2023 実施状況報告書
  • [学会発表] グラフ集約に基づく高速な最大k-plex探索2023

    • 著者名/発表者名
      真次 彰平, 藤原 靖宏, 塩川 浩昭
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 動的グラフにおけるk最近傍探索のための索引更新手法の提案2023

    • 著者名/発表者名
      小林 瑞季, 真次 彰平, 塩川 浩昭
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] グラフデータベースに対する高速高精度な相関問合せ2023

    • 著者名/発表者名
      直井 悠馬, 真次 彰平, 塩川 浩昭
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] DNAデータベースに対する効率的な相関問合せ手法の提案2023

    • 著者名/発表者名
      八木 隆一, 直井 悠馬, 塩川 浩昭
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 多次元時系列データに対する類似部分シーケンス問合せの高速化2023

    • 著者名/発表者名
      安田 裕真, 塩川 浩昭
    • 学会等名
      第15回データ工学と情報マネジメントに関するフォーラム
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] 多次元時系列データに対する高速なモチーフ問合せ手法の提案2023

    • 著者名/発表者名
      安田 裕真, 塩川 浩昭
    • 学会等名
      情報処理学会 第85回全国大会
    • 関連する報告書
      2022 実施状況報告書
  • [学会発表] Tree-Based Graph Indexing for Fast kNN Queries2022

    • 著者名/発表者名
      Suomi Kobayashi, Shohei Matsugu, Hiroaki Shiokawa
    • 学会等名
      The 24th International Conference on Information Integration and Web Intelligence
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Fast Top-k Similar Sequence Search on DNA Databases2022

    • 著者名/発表者名
      Ryuichi Yagi, Hiroaki Shiokawa
    • 学会等名
      The 24th International Conference on Information Integration and Web Intelligence
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Fast Similarity Search for Large Knowledge Graphs2022

    • 著者名/発表者名
      Hiroaki Shiokawa
    • 学会等名
      Aarhus Workshop on Graph Access and Analysis
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演
  • [学会発表] Graph-based Clustering at Scale2022

    • 著者名/発表者名
      Hiroaki Shiokawa
    • 学会等名
      Aarhus Workshop on Graph Access and Analysis
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会 / 招待講演

URL: 

公開日: 2022-04-19   更新日: 2024-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi