研究課題
データの分析は対象となるデータを分類することから始まる。分類は階層的に行われ、木構造の分類階層が構築される。一般にデータは最も細かい分類のいずれか1つに属すことが仮定されるが、東京と大阪の比較を行ったデータを都市レベルで分類するとき、そのデータは東京と大阪の両方に属させるのが適切であり、そのデータは東京に関するデータとしても大阪に関するデータとしても検索結果に含むことができる。しかし、東京に関するデータと大阪に関するデータの共通集合には東京と大阪以外にも分類されているデータが含まれており、東京と大阪のみに関するデータを求める際には、共通集合に含まれているデータから他に分類されているデータを除かなければならない。今年度は、他のデータを調べることなく、共通集合に含まれるデータのみから他には分類されていないことを判別できるようにするためのデータの構成手法を開発した。データを階層的に分類するときに、複数のクラス(分類されたデータ集合)に属することが適当であるデータは複数のクラスに重複して分類される。前年度に、重複したデータの1つをその親クラスのデータとして代表させることによってデータを検索する際に重複を除く方法を提案しているが、これを拡張し、代表となるデータに代表とはならなかったデータの情報を持たせることで共通集合のデータが他にも分類されているかどうかが判定できる。直感的には、本手法はデータのすべての重複が共通集合を求めるためのデータ集合に含まれているかどうかで判断していると考えることができる。データ分析のための分類は、知りたい情報を含むデータ1件にたどりつくための検索だけではなく、条件を満たすデータ集合を求めるための検索などを可能とする必要があり、本研究で開発した手法はそのような利用に対して有効なものとなる。
すべて 2006 2005
すべて 雑誌論文 (4件)
Proc.Int'l Conf.on Database and Applications
ページ: 135-142
情報処理学会論文誌データベース TOD 30(採録決定)
Proc.Int'l Conf.on World Multiconf.on Systemics, Cybernetics and Informatics Vol.3
ページ: 134-139
データベースとWeb情報システムに関するシンポジウム論文集
ページ: 213-220