研究実績の概要 |
(凝集的)階層クラスタリングとは, データの集合をいくつかの集合に分割するクラスタリング手法の一種である. この手法は有限集合X上の相違写像を入力とし, まず1つの要素だけを含むクラスタが|X|個ある状態を作る. この状態から始め, クラスタ間距離が最も近い2つのクラスタを併合する. この併合をすべての要素が1つのクラスタに含まれるまで繰り返し, クラスタの階層を生成する.階層クラスタリングにはクラスタ間距離の定義の違いにより,S-LinkやC-Linkなどがある. 階層クラスタリングによって生成されるクラスタの階層は指標付き階層構造であり,指標付き階層構造には超距離と呼ばれる相違写像のクラスが一対一に対応する. Trudeau (2012) によって導入された閉路完全距離は, 超距離を含む相違写像のクラスである.本研究課題の研究代表者らは昨年度,閉路完全距離には指標付き無閉路2-階層構造が一対一に対応するということを示した.指標付き階層構造の各階層はXの分割であるのに対して,指標付き無閉路2-階層構造の各階層にある異なる2つの集合は交わりを持つことが許される. 2019年度は, 階層クラスタリングの代表的なアルゴリズムであるS-LinkとC-Linkを拡張して, 指標付き無閉路2-階層構造を出力する階層重複クラスタリングアルゴリズムを開発した. これは,研究計画調書に記載した3つの研究課題のうち,「(2)閉路完全距離のグラフ表現と閉路完全距離による相違写像の近似」に関連する研究である.
|