研究課題
基盤研究(C)
本研究では、ストリームデータを対象とした類似検索を取り扱った。ストリーム内の直近のデータを要素が入れ替わる集合としてモデル化し、集合に対する類似検索技術を拡張して、ストリームデータに対する類似検索を実現した。とくに類似検索結果を確定するのに必要な分だけデータ間で類似度計算を行い、不要な類似度計算を避けることで類似検索を高速化した。また、ストリームデータに対する類似検索問題を定式化したこと自体も本研究の成果である。
データ構造、検索アルゴリズム
本研究で定式化した類似検索問題は情報推薦という現実的な応用を持つ。例えばSNSにおいては、ユーザUのストリームをUが投稿したテキスト群でモデル化できる。この時、ストリームのスライディングウインドウはユーザUが直近に投稿したテキスト集合となり、Uが最近興味を持った事象を色濃く反映している。従って、スライディングウィンドウが似たユーザを探すことで、最近の興味が似たユーザを発見できる。そして、類似ユーザが閲覧しているニュース記事をお薦めするといった情報推薦サービスも実現可能になる。