データマイニング間合せ最適化技術

研究課題

研究課題/領域番号	10480066
研究種目	基盤研究(B)
配分区分	補助金
応募区分	一般
研究分野	知能情報学
研究機関	東京大学
研究代表者	森下真一東京大学, 大学院・新領域創成科学研究科, 助教授 (90292854)
研究分担者	中谷明弘東京大学, 医科学研究所, 寄付研究部門教員 (60301149)
研究期間 (年度)	1998 – 2000
研究課題ステータス	完了 (2000年度)
配分額 *注記	10,400千円 (直接経費: 10,400千円) 2000年度: 1,500千円 (直接経費: 1,500千円) 1999年度: 5,000千円 (直接経費: 5,000千円) 1998年度: 3,900千円 (直接経費: 3,900千円)
キーワード	データマイニング / アソシエーションルール / アルゴリズム / データベース / 知識発見
研究概要	本研究に関する研究費を申請した1997年当時,統計的指標を最適化するアソシエーションルールを高速に枚挙することは市場からのニーズがあるものの,計算の高速化は難しいと考えられていた.Stanford大学やIBMワトソン研究所でも解決に向けた提案がされていたが,問題に制約を入れてから従来のAproriアルゴリズムをそのまま用いるという戦略で解いており,計算効率に問題があった.我々はこの問題への取り組みを開始したが,1997-9年半ばまでは,探索木を基本にそれを並列化により高速化するという極めてオーソドックスな解きかたに頼っており,残念ながらあまり効率的には動作しなかった. 我々は探索木の並列化という方針を諦めた.主記憶管理やバッファ管理に配慮したAprioriアルゴリズムは市場で非常によく利用されており,このアルゴリズムに若干の変更を加えることで統計的指標を扱えないかというアプローチを検討した.このようにすることで,開発した技術が容易に様々なソフトウエアに組み込めると言う利点がある.しかしAprioriは評価関数の反単調性に依存した方法であり,反単調性を持たない統計的指標に応用するのは見通しが得にくい. 1999年夏に統計的指標の上界を低コストで求める方法から反単調性を導いて,かつ枝狩りにも利用できることが分かった.Aprioriアルゴリズムと融合しても結果の正当性を保証できた.このアイデアを大学院生の瀬々潤君が本格的に実装したところ,良好な性能が得られた.国際的な評価も受け,ACM主催の理論系のデータベース国際会議PODSでの発表、および国際会議からの招待講演を2件受けた. 現在,1千万属性,数百万レコードのデータでさえ,標準的なPCワークステーション上で現実的な時間で処理できるまで実装が進んでおり,当初の目標を達成し,研究をまとめることができたのではないかと考えている.

報告書

(4件)

研究成果
(30件)

すべてその他

すべて文献書誌 (30件)

[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita and Akihiro Nakaya :: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel branch-and-bound graph search for correlated association rules"Lecture Notes in Artificial Intelligence, Springer, Proceedings of ACM SIGKDD Workshop on Large-Scale Parallel KDD Systems. Vol.1759. 127-144 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Akihiro Nakaya,Hideharu Furukawa and Shinichi Morishita: "Weighted Majority Decision among Several Region Rules for Scientific Discovery"Lecture Notes in Artificial Intelligence, Springer, Proc. of Second Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1721. 15-29 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takeshi Fukuda,Yasuhiko Morimoto,Shinichi Morishita,and Takeshi Tokuyama: "Mining Optimized Association Rules for Numeric Attributes"Journal of Computer and System Sciences-Special issue on the 15th ACM SIGACT-SIGMoD-SIGART Symposium on Principles of Database Systems, Academic Press. Vol.58,No.1. 1-12 (1999)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita: "On Classification and Regression"Lecture Notes in Artificial Intelligence, Springer, Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1532. 40-57 (1998)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] 森下真一,宮野悟編: "bit別冊「発見科学とデータマイニング」"共立出版. 320 (2000)
- 説明
  「研究成果報告書概要(和文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita, and Akihiro Nakaya: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D, No.1. 52-60 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Akihiro Nakaya, Hideharu Furukawa and Shinichi Morishita: "Weighted Majority Decision among Several Region Rules for Scientific Discovery."In Proc.of Second Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence, Springer. 15-29 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita, and Akihiro Nakaya: "Parallel branch-and-bound graph search for correlated association rules."Proceedings of ACM SIGKDD Workshop on Large-Scale Parallel KDD Systems, San Diego, August 1999. (Revised version : Lecture Notes in Artificial Intelligence, Springer). Vol.1759. 127-144 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Takeshi Fukuda, Yasuhiko Morimoto, Shinichi Morishita, and Takeshi Tokuyama: "Mining Optimized Association Rules for Numeric Attributes."Journal of Computer and System Sciences-Special issue on the 15th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Academic Press. 58(1). 1-12 (1999)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita: "On Classification and Regression."In Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence, Springer. Vol.1532. 40-57 (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinishi Morishita: "Association Rules, Boosting, and Genome Mining"Workshop on Data Mining in the Internet Age, DIMACS, San Jose, California, May 1-2. (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita: "On Classification and Regression."First Int'l Conf.on Discovery Science, Fukuoka, December. (1998)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita and Satoru Miyano Ed.: "Discovery Science and Data Mining"Special Issue of bit. 320 (2000)
- 説明
  「研究成果報告書概要(欧文)」より
- 関連する報告書
  2000 研究成果報告書概要
[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Shinichi Morishita and Akihiro Nakaya :: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel branch-and-bound graph search for correlated association rules"Lecture Notes in Artificial Intelligence, Springer, Proceedings of ACM SIGKDD Workshop on Large-Scale Parallel KDD Systems. Vol.1759. 127-144 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Akihiro Nakaya,Hideharu Furukawa and Shinichi Morishita: "Weighted Majority Decision among Several Region Rules for Scientific Discovery"Lecture Notes in Artificial Intelligence, Springer, Proc.of Second Int'l Conf. on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1721. 15-29 (1999)
- 関連する報告書
  2000 実績報告書
[文献書誌] Takeshi Fukuda,Yasuhiko Morimoto,Shinichi Morishita,and Takeshi Tokuyama: "Mining Optimized Association Rules for Numeric Attributes"Journal of Computer and System Sciences-Special issue on the 15th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems,Academic Press. Vol.58,No.1. 1-12 (1999)
- 関連する報告書
  2000 実績報告書
[文献書誌] Shinichi Morishita: "On Classification and Regression"Lecture Notes in Artificial Intelligence, Springer, Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1532. 40-57 (1998)
- 関連する報告書
  2000 実績報告書
[文献書誌] 森下真一,宮野悟編: "bit 別冊「発見科学とデータマイニング」"共立出版. 320 (2000)
- 関連する報告書
  2000 実績報告書
[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel Branch-and-Bound Graph Search for Correlated Associated Pules"Prof.of ACM SIG KDD workshop on Large-Scale Parallel KDD System. 25-34 (1999)
- 関連する報告書
  1999 実績報告書
[文献書誌] Shinichi Morishita and Akihoro Nakaya: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)
- 関連する報告書
  1999 実績報告書
[文献書誌] 森下真一、中谷明弘: "データマイニングの理論と実装"コンピュータソフトウェア. Vol.17 No.1. 59-72 (2000)
- 関連する報告書
  1999 実績報告書
[文献書誌] S.Morishita: "On classitication and regression" Lecture Notes in Computer Science. 1532. 40-57 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] Y.Morimoto, T.Fukuda S.Morishita, T.Tokuyama: "Implementation and Evaluation at Decision Trees with Range and Region Splitling" Coustraints. 発表予定(採択済).
- 関連する報告書
  1998 実績報告書
[文献書誌] 森下真一・中谷明弘: "データマイニングの実装と応用" 第15回大会併設チュートリアル(日本ソフトウエア科学会). 1-102 (1998)
- 関連する報告書
  1998 実績報告書
[文献書誌] 中谷明弘・森下真一: "ナノレベルのゲノム実験室" 情報処理. (採択済発表予定).
- 関連する報告書
  1998 実績報告書

データマイニング間合せ最適化技術

研究代表者

森下 真一 東京大学, 大学院・新領域創成科学研究科, 助教授 (90292854)

10,400千円 (直接経費: 10,400千円)

報告書

研究成果

[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita and Akihiro Nakaya :: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel branch-and-bound graph search for correlated association rules"Lecture Notes in Artificial Intelligence, Springer, Proceedings of ACM SIGKDD Workshop on Large-Scale Parallel KDD Systems. Vol.1759. 127-144 (2000)

説明

関連する報告書

説明

関連する報告書

説明

関連する報告書

[文献書誌] Shinichi Morishita: "On Classification and Regression"Lecture Notes in Artificial Intelligence, Springer, Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1532. 40-57 (1998)

説明

関連する報告書

[文献書誌] 森下真一,宮野悟 編: "bit別冊「発見科学とデータマイニング」"共立出版. 320 (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita, and Akihiro Nakaya: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D, No.1. 52-60 (2000)

説明

関連する報告書

[文献書誌] Akihiro Nakaya, Hideharu Furukawa and Shinichi Morishita: "Weighted Majority Decision among Several Region Rules for Scientific Discovery."In Proc.of Second Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence, Springer. 15-29 (1999)

説明

関連する報告書

説明

関連する報告書

説明

関連する報告書

[文献書誌] Shinichi Morishita: "On Classification and Regression."In Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence, Springer. Vol.1532. 40-57 (1998)

説明

関連する報告書

[文献書誌] Shinishi Morishita: "Association Rules, Boosting, and Genome Mining"Workshop on Data Mining in the Internet Age, DIMACS, San Jose, California, May 1-2. (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita: "On Classification and Regression."First Int'l Conf.on Discovery Science, Fukuoka, December. (1998)

説明

関連する報告書

[文献書誌] Shinichi Morishita and Satoru Miyano Ed.: "Discovery Science and Data Mining"Special Issue of bit. 320 (2000)

説明

関連する報告書

[文献書誌] Shinichi Morishita and Jun Sese: "Traversing Itemset Lattices with Statistical Metric Pruning"Proc.of ACM SIGACT-SIGMOD-SIGART Symp.on Database Systems (PODS). 226-236 (2000)

関連する報告書

[文献書誌] Shinichi Morishita and Akihiro Nakaya :: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)

関連する報告書

[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel branch-and-bound graph search for correlated association rules"Lecture Notes in Artificial Intelligence, Springer, Proceedings of ACM SIGKDD Workshop on Large-Scale Parallel KDD Systems. Vol.1759. 127-144 (2000)

関連する報告書

関連する報告書

関連する報告書

[文献書誌] Shinichi Morishita: "On Classification and Regression"Lecture Notes in Artificial Intelligence, Springer, Proc.of First Int'l Conf.on Discovery Science, Lecture Notes in Artificial Intelligence. Vol.1532. 40-57 (1998)

関連する報告書

[文献書誌] 森下真一,宮野悟 編: "bit 別冊「発見科学とデータマイニング」"共立出版. 320 (2000)

関連する報告書

[文献書誌] Shinichi Morishita and Akihiro Nakaya: "Parallel Branch-and-Bound Graph Search for Correlated Associated Pules"Prof.of ACM SIG KDD workshop on Large-Scale Parallel KDD System. 25-34 (1999)

関連する報告書

[文献書誌] Shinichi Morishita and Akihoro Nakaya: "Expressive Tests for Classification and Regression"Transaction of IEICE. Vol.E83-D No.1. 52-60 (2000)

関連する報告書

[文献書誌] 森下真一、中谷明弘: "データマイニングの理論と実装"コンピュータソフトウェア. Vol.17 No.1. 59-72 (2000)

関連する報告書

[文献書誌] S.Morishita: "On classitication and regression" Lecture Notes in Computer Science. 1532. 40-57 (1998)

関連する報告書

[文献書誌] Y.Morimoto, T.Fukuda S.Morishita, T.Tokuyama: "Implementation and Evaluation at Decision Trees with Range and Region Splitling" Coustraints. 発表予定(採択済).

関連する報告書

[文献書誌] 森下真一・中谷明弘: "データマイニングの実装と応用" 第15回大会併設チュートリアル(日本ソフトウエア科学会). 1-102 (1998)

関連する報告書

[文献書誌] 中谷明弘・森下真一: "ナノレベルのゲノム実験室" 情報処理. (採択済 発表予定).

関連する報告書

森下真一東京大学, 大学院・新領域創成科学研究科, 助教授 (90292854)

[文献書誌] 森下真一,宮野悟編: "bit別冊「発見科学とデータマイニング」"共立出版. 320 (2000)

[文献書誌] 森下真一,宮野悟編: "bit 別冊「発見科学とデータマイニング」"共立出版. 320 (2000)

[文献書誌] 中谷明弘・森下真一: "ナノレベルのゲノム実験室" 情報処理. (採択済発表予定).