1997 Fiscal Year Annual Research Report
Project/Area Number |
09780284
|
Research Institution | Nara Institute of Science and Technology |
Principal Investigator |
中西 隆一 奈良先端科学技術大学院大学, 情報科学研究科, 助手 (60263232)
|
Keywords | データマイニング / 頻出集合 / 計算複雑さ |
Research Abstract |
本研究で得られた成果は以下の(1)(2)である。 (1)商店における在庫管理を考える。アイテム(商品)の全体集合1が定まっているとする。1の部分集合をアイテム集合と呼ぶ。データベースDは各顧客が一度に買った商品からなるアイテム集合からなる多重集合(同じ要素が複数個含み得る集合)とする。アイテム集合Xが与えられた時、Xを部分集合として含むD中のアイテム集合の個数をDにおけるXのサポート数と呼び∴sup_D(X)と書く。最小サポート数と呼ばれる正整数sが与えられた時、sup_D(X)≧sならばXは頻出集合と呼ばれる。頻出集合が求められれば、在庫管理が効率よく行え、過剰在庫や在庫切れを避けることが出来る。頻出集合問題とは、データベースD、最小サポート数s及び最小サイズhという正整数が与えられた時、Dにおいて要素数h以上の頻出集合が存在するかどうかを判定する問題である。本研究では頻出集合問題がNP完全であることを示した。これにより、P=NPでない限り(a頻出集合の要素数の最大値や(b)全ての頻出集合等を多項式時間で求めることは不可能である。 (2)(1)より、頻出集合問題は一般に難しい。そこで、頻出集合が効率よく求められるデータベースの部分クラスを提案した。このクラスのデータベースに対しては、全ての頻出集合が多項式時間で求められる。
|
Research Products
(2 results)
-
[Publications] 巽 知厳, 中西隆一, 伊藤 実, 関 浩之: "データマイニングにおける頻出集合問題の計算複雑さ" 電子情報通信学会技術研究報告. COMP97-67. (1997)
-
[Publications] 権 娟大, 中西隆一, 伊藤 実, 中西通雄: "効率良く頻出集合をデータマイニング可能なデータベースクラスについて" 電子情報通信学会技術研究報告. (発表予定). (1998)