多次元データ空間においてデータの部分構造を発見するエージェント群の設計について研究を行なった。ここでは、多次元データ空間の各次元は1つの属性に対応させる。多次元データ空間に含まれる属性は、数値、記号、あるいはその両方を含んだ混合データである。そこで本研究では、各属性ごとに類似度を定義し、それらを統合してオブジェクト間類似度を定義することで様々なタイプの属性を持つデータベースに対応することとした。なお、記号属性の類似度はあらかじめその属性について知見があるならばそれを取り込んだ類似度を定義することが重要である。これにより、エージェントは任意次元におけるオブジェクト間類似度を知ることができる。エージェントが持つ内部モデルには、代表オブジェクトの置き換えルールと類似度が高いようなオブジェクトを集めるというルールを導入した。これにより大局的な評価関数を与えないで、エージェント群によりクラスタリングを行なうことができた。一般的にクラスタリングは実行前に評価関数(規範)やクラスタ数などのパラメータを与えなくてはならないが、本手法では、許容できる最小オブジェクト間類似度を与えるだけでクラスタリングを行なうことができる。次にエージェントの能力に線型モデルの構築を加えた。そしてエージェントが多次元データ空間から得た情報をルール形式で表現するために、エージェント内部にルールを記述する変数を撰択する集合群を定義した。
|