研究課題/領域番号 |
18H04095
|
研究機関 | 大阪大学 |
研究代表者 |
原 隆浩 大阪大学, 情報科学研究科, 教授 (20294043)
|
研究分担者 |
天方 大地 大阪大学, 情報科学研究科, 助教 (40770649)
前川 卓也 大阪大学, 情報科学研究科, 准教授 (50447025)
|
研究期間 (年度) |
2018-04-01 – 2023-03-31
|
キーワード | ビッグデータ / インデックス / データ検索 |
研究実績の概要 |
IoTを始めとして多種多様なビッグデータが発生しており、データ集合の特徴抽出や指定条件に合致するデータの取得など、検索技術へのニーズも多様化している。本研究課題では、このような多様な検索要求を満たすことができる統一的なインデックス基盤を確立することを目的とする。この目的を達成するために、2019年度は以下のように二つの研究課題を推進した。 課題1:多様な検索要求を満たす統一的なインデックス構造の構築 本課題では、多様な検索要求に対して、それぞれの検索の種類で効率化(探索空間の枝刈り・絞込みなど)に用いることのできる数学的・理論的アイデアを整理もしくは新たに定義する。そして、複数の異なる検索要求において共通して利用できる効率化手段を検討する。本研究課題の二年目にあたる2019年度は、初年度をさらに発展させて、いくつかの基礎的な検索技術に対して、各検索要求の整理と定義を行った。そして、それらの異なる検索技術のうち、数学的・理論的な手順の一部を共通化できるものが存在するかを検討した。その結果、任意の距離関数に対する近傍検索のためのデータ構造として最近用いられるようになったグラフインデックスに着目し、範囲検索や外れ値検索に用いることを試みた。 課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築 初年度に行った、共通化されたインデックス構造およびオンラインアルゴリズムに関する検討をさらに発展させた。特にグラフインデックスを一つの候補として、簡単な範囲検索や外れ値検索などを行うオンラインアルゴリズムを検討した。また、従来にない新たな高度検索技術として、ストリームデータに対する特徴パターン検索、外れ値検索、相関集合検索などを設計・実装した。それらを実行するための共通化インデックスについても検討を行った。
|
現在までの達成度 (区分) |
現在までの達成度 (区分)
1: 当初の計画以上に進展している
理由
共通化インデックスとして利用するデータ構造の候補の一つとして、グラフインデックスに着目し、いくつかの準備的な研究開発を実施したことは、特筆すべき進展である。グラフインデックスに基づく共通化インデックスを詳細に設計・実装することが次年度以降の最優先課題の一つである。さらに、高度な検索技術については、いくつかの重要な新技術を考案することに成功し、データベース分野で著名な国際会議に複数の論文が採録されるなど、重要な成果を達成した。以上のことから、当初の計画以上に進展していると判断した。
|
今後の研究の推進方策 |
次年度は、以下のように研究を推進する予定である。 課題1:多様な検索要求を満たす統一的なインデックス構造の構築 2020年度はこれまでの成果をさらに発展させて、いくつかの基礎的および高度な検索技術に対して、数学的・理論的な手順の一部を共通化できるものが存在するかを検証し、存在する場合はそれらを共通クラスとして捉え、検索理論・手順を再整理する。その結果に従って、そのクラスに共通化されたインデックス構造について検討を進める。例えば、任意の距離空間に適用可能なインデックス構造としてグラフインデックスを一つの候補として研究を推進する。 課題2:統一的なインデックス構造上のオンライン検索アルゴリズムの構築 これまでに行った、共通化されたインデックス構造およびオンラインアルゴリズムに関する検討をさらに発展させる。特に、グラフインデックス上の高速な検索技術について検討する。また、新たな高度検索技術について研究開発をさらに発展させ、それらを実行するための共通化インデックスについても検討を進める。
|