データ群を分類する場合、各データから特徴量ベクトルを算出し、算出した特徴ベクトル間の距離が用いられる。しかし、データから特徴ベクトルを抽出できるとは限らない。この場合、距離を使用することはできない。この場合、距離の使用を前提としないクラスタリングアルゴリズムが必須となる。本研究では、相互に類似しているデータ間では、検索を実施した場合、相互に検索結果が上位になるという事象を、相互隣接グラフ(MNN-Graph)表現し、相互隣接グラフのクリーク発見するというものである。提案アルゴリズムは、閾値のチューニング・速度等に問題があるが、クラスタリング過程が説明可能であることが分かった。
|