本研究で得られた成果は以下の(1)(2)である。 (1)商店における在庫管理を考える。アイテム(商品)の全体集合1が定まっているとする。1の部分集合をアイテム集合と呼ぶ。データベースDは各顧客が一度に買った商品からなるアイテム集合からなる多重集合(同じ要素が複数個含み得る集合)とする。アイテム集合Xが与えられた時、Xを部分集合として含むD中のアイテム集合の個数をDにおけるXのサポート数と呼び∴sup_D(X)と書く。最小サポート数と呼ばれる正整数sが与えられた時、sup_D(X)≧sならばXは頻出集合と呼ばれる。頻出集合が求められれば、在庫管理が効率よく行え、過剰在庫や在庫切れを避けることが出来る。頻出集合問題とは、データベースD、最小サポート数s及び最小サイズhという正整数が与えられた時、Dにおいて要素数h以上の頻出集合が存在するかどうかを判定する問題である。本研究では頻出集合問題がNP完全であることを示した。これにより、P=NPでない限り(a頻出集合の要素数の最大値や(b)全ての頻出集合等を多項式時間で求めることは不可能である。 (2)(1)より、頻出集合問題は一般に難しい。そこで、頻出集合が効率よく求められるデータベースの部分クラスを提案した。このクラスのデータベースに対しては、全ての頻出集合が多項式時間で求められる。
|