時系列データの多くは長さの異なる非ベクトルデータであり、そのマッチングには三角不等式を満たさない擬距離である動的時間伸縮(DTW)距離がしばしば用いられてきた.DTW擬距離を距離とみなし、時系列データを距離を保存するようにユークリッド空間へ埋め込み、ベクトルデータに変換する. 距離が与えられたデータ集合のユークリッド空間への埋め込みには、多次元尺度法(MDS)がよく知られている.しかし.DTW距離は擬距離であるため.MDSによる埋め込みではカーネル行列の半正定値性を満たせず、結果的に大きな誤差が発生する. 本研究では、上記問題点を持たない埋め込み手法として、半正定値計画法による埋め込みを検討した.DTW距離から求めるカーネル行列の半正定値性を拘束条件として、埋め込み前と埋め込み後の距離の差を最小化する最適化問題を解く.サンプル時系列データ集合のカーネル行列を求める問題を、近傍保存埋め込み(NPE)とよぶ半正定値計画問題として定式化した.さらに、新たな時系列データが与えられたとき、NPEで求めたカーネル行列を拡張する問題をサンプル外拡張(OSE)とよぶ半正定値計画問題として定式化した.NPE、OSEにより求めたDTWカーネルの有効性をSVMを用いた分類問題、類似検索に関する予備実験にて検証した.その結果、分類問題においては、k近傍法や、半正定値性を満たさないカーネルを用いた手法より、高い精度が得られた.
|