2021 Fiscal Year Annual Research Report
Implementation of Unified Indexing Mechanisms Satisfying Various Retrieval Requirements for Big Data Era
Project/Area Number |
18H04095
|
Research Institution | Osaka University |
Principal Investigator |
原 隆浩 大阪大学, 情報科学研究科, 教授 (20294043)
|
Co-Investigator(Kenkyū-buntansha) |
天方 大地 大阪大学, 情報科学研究科, 助教 (40770649)
前川 卓也 大阪大学, 情報科学研究科, 准教授 (50447025)
|
Project Period (FY) |
2018-04-01 – 2023-03-31
|
Keywords | ビッグデータ / インデックス / データ検索 |
Outline of Annual Research Achievements |
IoTを始めとして多種多様なビッグデータが発生しており、データ集合の特徴抽出や指定条件に合致するデータの取得など、検索技術へのニーズも多様化している。本研究課題では、このような多様な検索要求を満たすことができる統一的なインデックス基盤を確立することを目的とする。この目的を達成するために、2021年度は以下のように二つの研究課題を推進した。 課題1:多様な検索要求を満たす統一的なインデックス構造の構築 本課題では、多様な検索要求に対して、それぞれの検索の種類で効率化(探索空間の枝刈り・絞込みなど)に用いることのできる数学的・理論的アイデアを整理もしくは新たに定義する。そして、複数の異なる検索要求において共通して利用できる効率化手段を検討する。本研究課題の四年目にあたる2021年度は、これまでの研究をさらに発展させて、より高度かつ新たな検索問題を想定し、これらの検索を効率的に実行するための数学的・理論的な基盤に基づいたインデックス構造を考案した。例えば、任意の距離空間に適用可能なインデックス構造として、近似グラフや最近傍グラフなどに基づくグラフインデックスを採用した。 課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築 上記の高度な検索の処理に適したグラフインデックスにおいて、検索を高速に実行可能なオンラインアルゴリズムを考案した。特に、新たな高度検索問題として、逆最大内積探索、外れ値検索、近似Top-k内積結合、Top-k空間キーワード類似結合などのアルゴリズムを設計・実装した。
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
昨年度の研究成果を発展させて、様々な高度な検索を実行するためのグラフインデックスを構築し、単純なアプローチや既存アプローチと比較して数十倍から数百倍は高速なオンラインアルゴリズムを開発した。これらの研究成果は、データベース分野で最高峰の論文誌(The VLDB Journal)や国際会議(SIGSPATIAL、RecSys、SIGMOD)に公表するなど、大きな成果を達成した。以上のことから、当初の計画以上に進展していると判断した。
|
Strategy for Future Research Activity |
今後は以下のように研究を推進する。 課題1:多様な検索要求を満たす統一的なインデックス構造の構築 本課題では、多様な検索要求に対して、それぞれの検索の種類で効率化(探索空間の枝刈り・絞込みなど)に用いることのできる数学的・理論的アイデアを整理もしくは新たに定義する。そして、複数の異なる検索要求において共通して利用できる効率化手段を検討する。本研究課題の最終年度にあたる2022年度は、これまでの成果をさらに発展させて、さまざまな高度な検索に適用可能なグラフインデックスの構築を進めつつ、研究期間全体で達成した成果の取りまとめを行う。 課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築 主にグラフインデックスを想定して、新たな検索の概念を考案するとともに、その高速なオンライン検索アルゴリズムを設計・実装する。さらに、本研究のとりまとめとして、これまでに考案した検索技術を整理し、インデックスの共通化の観点から体系化を進める。本研究で開発したインデックスやオンライン検索アルゴリズムは、可能な範囲で積極的に公開し、他の研究者や技術者による利用を促進する。
|
Research Products
(13 results)