研究概要 |
本研究は,マルチメディアデータ検索の重要な基礎技術である近傍探索技術の高速化を目的とする.具体的には,楽曲から抽出される特徴量の時系列データに対する高速検索手法の開発と,画像から抽出される高次元特徴ベクトルの集合に対する高速近傍探索手法の開発を行う.我々は,研究期間内に,Lp距離間の変換規則を基にした索引構造の生成アルゴリズムを実装し,大量時系列データと画像データの2種類のデータベースに対して索引空間を生成し,高速な検索が可能であるかどうかを検証する. 本年度の目的は,大量の多次元時系列データを用意し,用意した多次元時系列を問い合わせとし,多次元時系列区間を高速に検索するための索引構造の提案を行うことであった. 目的に対して, 1.約18,000曲の楽曲に対して、TwinVQ圧縮を適用し,圧縮時に算出される1024次元のMDCT係数,21次元の自己相関係数,20次元のLSPパラメータ,40次元のLPCケプストラムなどのデータを取得した. 2.約3,500曲からなるデータ集合を作成し,40次元のLPCケプストラムの時系列を検索する実験を行った.索引構造を用いない手法では,一回の問い合わせに要する検索時間は約45分程度であることがわかった. 3.現在,Lp距離間の変換規則を基にした索引構造による検索実験を開始し始めた.
|