• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2021 Fiscal Year Annual Research Report

Implementation of Unified Indexing Mechanisms Satisfying Various Retrieval Requirements for Big Data Era

Research Project

Project/Area Number 18H04095
Research InstitutionOsaka University

Principal Investigator

原 隆浩  大阪大学, 情報科学研究科, 教授 (20294043)

Co-Investigator(Kenkyū-buntansha) 天方 大地  大阪大学, 情報科学研究科, 助教 (40770649)
前川 卓也  大阪大学, 情報科学研究科, 准教授 (50447025)
Project Period (FY) 2018-04-01 – 2023-03-31
Keywordsビッグデータ / インデックス / データ検索
Outline of Annual Research Achievements

IoTを始めとして多種多様なビッグデータが発生しており、データ集合の特徴抽出や指定条件に合致するデータの取得など、検索技術へのニーズも多様化している。本研究課題では、このような多様な検索要求を満たすことができる統一的なインデックス基盤を確立することを目的とする。この目的を達成するために、2021年度は以下のように二つの研究課題を推進した。
課題1:多様な検索要求を満たす統一的なインデックス構造の構築
本課題では、多様な検索要求に対して、それぞれの検索の種類で効率化(探索空間の枝刈り・絞込みなど)に用いることのできる数学的・理論的アイデアを整理もしくは新たに定義する。そして、複数の異なる検索要求において共通して利用できる効率化手段を検討する。本研究課題の四年目にあたる2021年度は、これまでの研究をさらに発展させて、より高度かつ新たな検索問題を想定し、これらの検索を効率的に実行するための数学的・理論的な基盤に基づいたインデックス構造を考案した。例えば、任意の距離空間に適用可能なインデックス構造として、近似グラフや最近傍グラフなどに基づくグラフインデックスを採用した。
課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築
上記の高度な検索の処理に適したグラフインデックスにおいて、検索を高速に実行可能なオンラインアルゴリズムを考案した。特に、新たな高度検索問題として、逆最大内積探索、外れ値検索、近似Top-k内積結合、Top-k空間キーワード類似結合などのアルゴリズムを設計・実装した。

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

昨年度の研究成果を発展させて、様々な高度な検索を実行するためのグラフインデックスを構築し、単純なアプローチや既存アプローチと比較して数十倍から数百倍は高速なオンラインアルゴリズムを開発した。これらの研究成果は、データベース分野で最高峰の論文誌(The VLDB Journal)や国際会議(SIGSPATIAL、RecSys、SIGMOD)に公表するなど、大きな成果を達成した。以上のことから、当初の計画以上に進展していると判断した。

Strategy for Future Research Activity

今後は以下のように研究を推進する。
課題1:多様な検索要求を満たす統一的なインデックス構造の構築
本課題では、多様な検索要求に対して、それぞれの検索の種類で効率化(探索空間の枝刈り・絞込みなど)に用いることのできる数学的・理論的アイデアを整理もしくは新たに定義する。そして、複数の異なる検索要求において共通して利用できる効率化手段を検討する。本研究課題の最終年度にあたる2022年度は、これまでの成果をさらに発展させて、さまざまな高度な検索に適用可能なグラフインデックスの構築を進めつつ、研究期間全体で達成した成果の取りまとめを行う。
課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築
主にグラフインデックスを想定して、新たな検索の概念を考案するとともに、その高速なオンライン検索アルゴリズムを設計・実装する。さらに、本研究のとりまとめとして、これまでに考案した検索技術を整理し、インデックスの共通化の観点から体系化を進める。本研究で開発したインデックスやオンライン検索アルゴリズムは、可能な範囲で積極的に公開し、他の研究者や技術者による利用を促進する。

  • Research Products

    (13 results)

All 2022 2021

All Journal Article (1 results) (of which Peer Reviewed: 1 results) Presentation (12 results) (of which Int'l Joint Research: 7 results)

  • [Journal Article] Fast, Exact, and Parallel-friendly Outlier Detection Algorithms with Proximity Graph in Metric Spaces2022

    • Author(s)
      Amagata Daichi, Onizuka Makoto, and Hara Takahiro
    • Journal Title

      The VLDB Journal

      Volume: - Pages: -

    • DOI

      10.1007/s00778-022-00729-1

    • Peer Reviewed
  • [Presentation] A Performance Study of One-dimensional Learned Cardinality Estimation2022

    • Author(s)
      Yuchen Ji, Daichi Amagata, Yuya Sasaki, and Takahiro Hara
    • Organizer
      International Workshop on Design, Optimization, Languages and Analytical Processing of Big Data (DOLAP)
    • Int'l Joint Research
  • [Presentation] 空間データにおける重み付き三角形の効率的なTop-kモニタリング2022

    • Author(s)
      谷口 凌亮, 天方 大地, 原 隆浩
    • Organizer
      第14回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2022)
  • [Presentation] 高速かつ高精度な内積空間におけるカーディナリティ推定2022

    • Author(s)
      平田 皓平, 天方 大地, 原 隆浩
    • Organizer
      第14回データ工学と情報マネジメントに関するフォーラム(DEIMフォーラム2022)
  • [Presentation] Approximate Top-k Inner Product Join with a Proximity Graph2021

    • Author(s)
      Hayato Nakama, Daichi Amagata, and Takahiro Hara
    • Organizer
      IEEE International Conference on Big Data (IEEE BigData)
    • Int'l Joint Research
  • [Presentation] Feat-SKSJ: Fast and Exact Algorithm for Top-k Spatial-Keyword Similarity Join2021

    • Author(s)
      Daichi Amagata, Shohei Tsuruoka, Yusuke Arai, and Takahiro Hara
    • Organizer
      ACM SIGSPATIAL International Conference on Advances in Geographic Information System (SIGSPATIAL)
    • Int'l Joint Research
  • [Presentation] Reverse Maximum Inner Product Search: How to Efficiently Find Users Who Would Like to Buy My Item?2021

    • Author(s)
      Daichi Amagata and Takahiro Hara
    • Organizer
      ACM Recommender Systems Conference (RecSys)
    • Int'l Joint Research
  • [Presentation] LGTM: A Fast and Accurate kNN Search Algorithm in High-dimensional Spaces2021

    • Author(s)
      Yusuke Arai, Daichi Amagata, Sumio Fujita, and Takahiro Hara
    • Organizer
      International Conference on Database and Expert Systems Applications (DEXA)
    • Int'l Joint Research
  • [Presentation] Fast Density-Peaks Clustering: Multicore-based Parallelization Approach2021

    • Author(s)
      Daichi Amagata and Takahiro Hara
    • Organizer
      ACM SIGMOD International Conference on Management of Data (SIGMOD)
    • Int'l Joint Research
  • [Presentation] Fast and Exact Outlier Detection in Metric Spaces: A Proximity Graph-based Approach2021

    • Author(s)
      Daichi Amagata, Makoto Onizuka, and Takahiro Hara
    • Organizer
      ACM SIGMOD International Conference on Management of Data (SIGMOD)
    • Int'l Joint Research
  • [Presentation] 空間データにおける重み付き三角形の効率的なTop-k検索アルゴリズム2021

    • Author(s)
      谷口 凌亮, 天方 大地, 原 隆浩
    • Organizer
      FIT2021 第20回情報科学技術フォーラム
  • [Presentation] 内積空間におけるカーディナリティ推定2021

    • Author(s)
      平田 皓平, 天方 大地, 原 隆浩
    • Organizer
      FIT2021 第20回情報科学技術フォーラム
  • [Presentation] 近似最大内積探索問題を利用した効率的なアウトライア検出アルゴリズム2021

    • Author(s)
      仲摩 隼人, 天方 大地, 原 隆浩
    • Organizer
      FIT2021 第20回情報科学技術フォーラム

URL: 

Published: 2022-12-28  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi