本研究では、機械学習に基づくデータマネジメントについてのクエリ処理を対象として、効率的なクエリ処理手法の開発に関する研究を行った。特に、埋め込みベクトルに対するクエリを効率的に処理するため、二つの解決策を開発した。1つ目は、2値の高次元ベクトルに対して、ハミング距離制約のある類似クエリを効率的に回答する。2つ目は、実数値の高次元ベクトルに対して、階層的なグラフ構造を用いて、近似最近傍探索を行う。また、機械学習の述語を含むクエリの処理を研究し、カーディナリティ推定により高速なクエリプランを生成する手法を開発した。システムのプロトタイピングと評価を行い、ソフトウェアのソースコードを公開した。
|