多次元データ空間においてデータの部分構造を発見するエージェント群の設計について研究を行なった。多次元データ空間に含まれる属性は、数値、記号あるいはその両方を含んだ混合データである。本研究では、各属性毎に類似度を定義し、それらを統合してオブジェクト間類似度を定義することで様々なタイプの属性を持つデータベースに対応することとした。なお、記号属性の類似度はあらかじめその属性について知見があるならばそれを取り込んだ類似度を定義することが重要である。多次元データ空間に投入されるエージェントは任意次元のオブジェクト間類似度に基づき、オブジェクトを任意の次元で集める。そのとき考慮した属性から張られる空間でエージェントはルールを次第に形成していく。今回は、まえもって、予測あるいは説明したい属性を与えることとした。各エージェントがとりこむ属性あるいはオブジェクトによって、それが持つif-thenルールの形態は変化していく。たとえば、条件部に関していえば、条件部を構成する属性が記号属性からなるか、数値属性(分布)からなるか、あるいはその両方の属性が混在するといったこと、結論部に関していえば、結論部を構成するのが記号属性ならば説明したい属性自身、数値属性ならば分布、あるいは、それを説明する回帰モデルといった具合である。したがって、エージェントがオブジェクトを集める工程が進んでいくと、エージェント内部規範(類似度)は、任意次元での密集度を重要視するのか、または、ルール(知識)としてより広範囲なカバー領域を得るために、ルールの結論部に線形回帰モデルを構築するような属性の探索と回帰係数の同定の両方を重要視するのか、なめらかに変化する必要がある。3次元の人工データを用いてエージェントがそれぞれ内部規範を変化させていくことを行なった。
|