大規模並列プロセッサを用いた相関ルールマイニングの超並列処理方式に関する研究

研究課題

研究課題/領域番号	11558030
研究種目	基盤研究(B)
配分区分	補助金
応募区分	展開研究
研究分野	計算機科学
研究機関	東京大学
研究代表者	喜連川優東京大学, 生産技術研究所, 教授 (40161509)
研究分担者	林周志東京大学, 生産技術研究所, 助手 (50282596) 中山雅哉東京大学, 情報基盤センター, 助教授 (90217943) 中野美由紀東京大学, 生産技術研究所, 助手 (30227863) 鳥居俊一日立製作所, ビジネスソリューション開発本部, 技術主幹
研究期間 (年度)	1999 – 2000
研究課題ステータス	完了 (2000年度)
配分額 *注記	13,600千円 (直接経費: 13,600千円) 2000年度: 6,500千円 (直接経費: 6,500千円) 1999年度: 7,100千円 (直接経費: 7,100千円)
キーワード	データマイニング処理 / 並列データベース処理 / 分散処理 / 並列データベース
研究概要	本研究では、超並列相関ルールマイニングアルゴリズムを開発し、大規模並列コンピュータ(100プロセッサ)上に実現することで、その超高性能化を試み、従来、全く処理不能と考えられてきた巨大データのマイニングを可能とする基盤技術の実用化を目的とする。平成11年度は、時系列データに対する概念階層を考慮した相関ルールマイニング並列処理アルゴリズムの設計を行ない,候補ルールに関してもハッシュ関数を利用して分散する新しい超並列化手法を提案した。また,数十台規模のPCクラスタを用いて予備実験を行なった。さらに概念階層と出現頻度を考慮した新しい実行時動的負荷分散手法の開発について検討を行った。平成12年度は、概念階層を考慮した相関ルールマイニング並列処理アルゴリズムに関し、SQLによる記述を行い、PCクラスタおよび商用データベース上で実行することにより、我々の提案する並列データマイニングアルゴリズムの大規模データベースエンジンへの実用化の検討を行った。大規模PCクラスタ上のSQL処理系を用いたデータマイニングを実装し、直接C言語で記述されたデータマイニングプログラムと比較した。実際の実装を通じて、通常の相関ルールのマイニングに対して4ノードで階層関係を考慮するマイニングで6〜8ノードを用いればCによる実装と同じぐらいの処理速度が実現できることを確認した.さらに、C記述からSQLへの効率の低下割合などを検討することにより、SQLマイニングの有効性を明確にした。

報告書

(3件)

2000 実績報告書研究成果報告書概要
1999 実績報告書

研究成果
(19件)

すべてその他

すべて文献書誌 (19件)

[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining ISBN 3-540-67194-3. 145-160 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Masahisa Tamura, Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM. 15-26 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Takeshi Yoshizawa, Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000),, University of Aizu. 20-32 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Parallel SQL Based Association Rule Mining on Large Scale PC Cluster : Performance Comparison with Directly Coded C Implementation"Proceedings of Third Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD99). 94-98 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takahiko Shintani, Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 35-44 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RDB Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knowledege Discovery (DAWAK99). 281-292 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining. ISBN 3-540-67194-3. 145-160 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Masahisa Tamura, Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM 2000. 15-26 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Takeshi Yoshizawa, Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000). 20-32 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Parallel SQL Based Association Rule Mining on Large Scale PC Cluster : Performance Comparison with Directly Coded C Implementation"Proceedings of Third Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD99). 94-98 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takahiko Shintani, Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 25-44 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RDB Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knowledege Discovery (DAWAK99). 28-292 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining ISBN 3-540-67194-3. 145-160 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Masaru Kitsuregawa,Takahiko Shintani,Masahisa Tamura,Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM. 15-26 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Masaru Kitsuregawa,Takahiko Shintani,Takeshi Yoshizawa,Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000),,University of Aizu. 20-32 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Iko Pramdino,Takahiko Shintani,Takayuki Tamura,Masaru Kitagawa: "Parallel SQL Based Association Rule Mining on Large Scale PC Cluster : Performance Comparison with Directly Coded C Implementation"Proceedings of Third Pacific-Asea Conference on Knowledge Discovery and Data Mining (PAKDD99). 94-98 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] Takahiko Shintani,Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 35-44 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] Iko Pramdiono,Takahiko Shintani,Takayuki Tamura,Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RBD Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knoledege Discovery (DAWAK99). 281-292 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] Takahiko Shintani,Masato Oguchi,Masaru Kitsuregawa: "Performance Analysis for Parallel Generalized Association Rule Mining on a Large Scale PC Cluster"Euro-par'99 Parallel Processing 5th International Euro-Par Conference. 1455-1459 (1999)
- 関連する報告書
  1999 実績報告書

大規模並列プロセッサを用いた相関ルールマイニングの超並列処理方式に関する研究

研究代表者

喜連川 優 東京大学, 生産技術研究所, 教授 (40161509)

13,600千円 (直接経費: 13,600千円)

報告書

研究成果

[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining ISBN 3-540-67194-3. 145-160 (2000)

説明

関連する報告書

[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Masahisa Tamura, Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM. 15-26 (2000)

説明

関連する報告書

[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Takeshi Yoshizawa, Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000),, University of Aizu. 20-32 (2000)

説明

関連する報告書

説明

関連する報告書

[文献書誌] Takahiko Shintani, Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 35-44 (1999)

説明

関連する報告書

[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RDB Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knowledege Discovery (DAWAK99). 281-292 (1999)

説明

関連する報告書

[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining. ISBN 3-540-67194-3. 145-160 (2000)

説明

関連する報告書

[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Masahisa Tamura, Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM 2000. 15-26 (2000)

説明

関連する報告書

[文献書誌] Masaru Kitsuregawa, Takahiko Shintani, Takeshi Yoshizawa, Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000). 20-32 (2000)

説明

関連する報告書

説明

関連する報告書

[文献書誌] Takahiko Shintani, Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 25-44 (1999)

説明

関連する報告書

[文献書誌] Iko Pramdiono, Takahiko Shintani, Takayuki Tamura, Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RDB Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knowledege Discovery (DAWAK99). 28-292 (1999)

説明

関連する報告書

[文献書誌] Takahiko Shintani and Masaru Kitsuregawa: "Parallel Generalized Association Rule Mining on Large Scale PC Cluster"Large-Scale Parallel Data Mining ISBN 3-540-67194-3. 145-160 (2000)

関連する報告書

[文献書誌] Masaru Kitsuregawa,Takahiko Shintani,Masahisa Tamura,Iko Pramudiono: "Parallel Data Mining on Large Scale PC cluster (Key note address)"WAIM. 15-26 (2000)

関連する報告書

[文献書誌] Masaru Kitsuregawa,Takahiko Shintani,Takeshi Yoshizawa,Iko Pramudiono: "Web Log Mining and Parallel SQL Based Execution (Key note address)"International Workshop on Databases in Networked Information Systems (DNIS2000),,University of Aizu. 20-32 (2000)

関連する報告書

関連する報告書

[文献書誌] Takahiko Shintani,Masaru Kitsuregawa: "Parallel Generalized Association rule Mining on Large Scale PC Cluster"Proceedings of Workshop on Large-Scale Parallel KDD Systems. 35-44 (1999)

関連する報告書

[文献書誌] Iko Pramdiono,Takahiko Shintani,Takayuki Tamura,Masaru Kitsuregawa: "Mining Generalized Association Rule using Parallel RBD Engine on PC Cluster"Proceedings of First International Conference on Data Warehousing and Knoledege Discovery (DAWAK99). 281-292 (1999)

関連する報告書

[文献書誌] Takahiko Shintani,Masato Oguchi,Masaru Kitsuregawa: "Performance Analysis for Parallel Generalized Association Rule Mining on a Large Scale PC Cluster"Euro-par'99 Parallel Processing 5th International Euro-Par Conference. 1455-1459 (1999)

関連する報告書

喜連川優東京大学, 生産技術研究所, 教授 (40161509)