ラフ集合理論の属性縮約は,対象集合の識別可能性/不能性に基づき,データから冗長な属性を取り除く手法である.本課題は,名義的データに対して,識別可能性に基づく二つの類似度/非類似度を提案した.一つは,クラスター間の非類似度であり,その値は二つのクラスターを識別する属性部分集合の数で定義される.もう一つは,識別可能性を反映した特徴空間に対するカーネル関数であり,その特徴空間は与えられた情報と整合する属性部分集合族である.これらの類似度/非類似度をクラスタリングと決定ルール抽出に適用した結果,分類性能と表現の簡潔さを両立させるようなクラスターや決定ルール群が得られることが実験的に明らかになった.
|