研究概要 |
本研究ではクラスタリング問題の持つ幾何構造に着目し効率の良いアルゴリズムを提案しその理論的な解析および実験による検証を行なった上で実際の応用を行なっている。応用に関しては特に近年注目をあびている巨大データベースに潜在的に内在する意味のある情報を抽出するためのデータマイニングについて理論的な裏付けを伴った実装をめざしている。 幾何的なクラスタリング問題において評価基準を代表点距離の自乗和,あるいはクラスタ内全点間距離二乗和の最小化とする場合、それぞれボロノイ図(borros,hammer)および重みつきボロノイ図(稲葉,今井)で特徴づけられることが知られている。 一般にボロノイ図構成にかかる計算量は次元があがると指数的に増加するため高次元のものと低中次元のものはわけて取り扱うことが必要となっている。低次元問題においていはこの特徴を活かしたランダマイズドアルゴリズムが提案され、色量子化問題および時空間データマイニングに応用を行なった。 高次元問題については全文データベースや画像データベースでの類似度検索について牽引空間や特徴空間と呼ばれる空間での距離に基づいて類似なものをまとめるクラスタリングとしての応用を行なっている。
|