研究概要 |
本研究は,マルチメディアデータ検索の重要な基礎技術である近傍探索技術の高速化を目的とする.具体的には,楽曲から抽出される特徴量の時系列データに対する高速検索手法の開発と,画像から抽出される高次元特徴ベクトルの集合に対する高速近傍探索手法の開発を行う.我々は,研究期間内に,Lp距離間の変換規則を基にした索引構造の生成アルゴリズムを実装し,大量時系列データと画像データの2種類のデータベースに対して索引空間を生成し,高速な検索が可能であるかどうかを検証する. 本年度の目的は,部分時系列を問い合わせとし,約1,250万点の時系列データから、問い合わせ部分時系列と類似する時系列区間を高速に検索するための索引構造の提案を行うことであった. 目的に対して,提案したLp距離変換規則に基づいた索引構造を新たに実装した.実装した索引構造の基本的なアイデアは,各時系列区間と原点0からのLp距離(p=1,2,∞)を計算し,Lp距離変換規則にしたがって,問い合わせ区間との距離計算不要区間を抽出し,類似度を計算するための距離計算回数を削減するというものである.検索実験では,約1,250万点からなる10種類の楽曲時系列データに対して約220万回(22万×10)の部分問い合わせを実行,k近傍検索に要する時間を測定した.64次元の部分区間問い合わせに要する検索時間は0.5秒以下であった.すなわち,提案する索引構造を利用することにより,高速な検索が可能であることがわかった.
|