Data Mining Method for Multi-viewpoint and Multi-granularity Knowledge Discovery

Research Project

Project/Area Number	16300042
Research Category	Grant-in-Aid for Scientific Research (B)
Allocation Type	Single-year Grants
Section	一般
Research Field	Intelligent informatics
Research Institution	Yokohama National University
Principal Investigator	SUZUKI Einoshin Yokohama National University, Faculty of Engineering, Associate Professor, 大学院・工学研究院, 助教授 (10251638)
Co-Investigator(Kenkyū-buntansha)	ANDO Shin Yokohama National University, Faculty of Engineering, Assistant Professor, 大学院・工学研究院, 助手 (70401685)
Project Period (FY)	2004 – 2005
Project Status	Completed (Fiscal Year 2005)
Budget Amount *help	¥14,300,000 (Direct Cost: ¥14,300,000) Fiscal Year 2005: ¥5,400,000 (Direct Cost: ¥5,400,000) Fiscal Year 2004: ¥8,900,000 (Direct Cost: ¥8,900,000)
Keywords	Multi-viewpoint and Multi-granularity Visualization / Web Page Data / Network Intrusion Data / Probabilistic Clustering / Transactional Data / Spatio-temporal Data / Data Mining / Information Visualization / 多視点・多粒度型知識発見 / シーケンスデータ
Research Abstract	We have invented a method which summarizes essential parts of data with probabilistic clustering and allocates hues based on information criteria as a data mining method for multi-viewpoint and multi-granularity knowledge discovery. This method is an extension of our PrototypeLines, of which effectiveness has been demonstrated with medical test data. We have investigated the effectiveness of the method with Web Page data, which represent a typical text and image data, and have exhibited that our method is superior to Google in terms of recall, precision, and computational time. The method has been improved and extended to the final method, of which effectiveness has been evaluated quantitatively by applying it to Web page data and network intrusion data. Experiments with Web page data were performed for a task of grasping the content of a large number of Web pages from a visualization result on a sheet of A4 paper. Because of the style of asking many questions in a limited period, we ha … More ve adopted the number of correct answers of the subjects as the evaluation index, and our method has succeeded to increase the value of the index by 35 % compared with Google. Though specific routines for images and keywords are necessary, we consider that we have accomplished the initial objective of visualizing information with appropriate viewpoints and granularities for knowledge discovery. For the experiments using network intrusion data, we have chosen prediction problems from access log to Web pages. Excellent results have been obtained in terms of recall and precision for malicious access detection, discovery of peculiar fraudulent access, and comprehensiveness of visualization results. In the process, we have developed a multi-objective search method, an information evaluation index, and clustering methods for predicate logic data and have confirmed their effectiveness. In addition, we have developed visualization methods for transactional data of itemsets in cooperation with the University of Caen in France and obtained excellent results. Applications to various statio-temporal data, of which soccer data is representative, have been pursued and excellent results have been obtained in both visualization and knowledge discovery. Less

Report

(3 results)

2005 Annual Research Report Final Research Report Summary
2004 Annual Research Report

Research Products
(28 results)

All 2006 2005 2004

All Journal Article (26 results) Book (2 results)

[Journal Article] Classlficatlon non-supervisee de donnees relationnelles2006
- Author(s)
  Jerome Maloberti, Shin Ando, Einoshin Suzuki
- Journal Title
  
  Extraction et Gestion des Connaissances (EGC)
  
  Pages: 389-390
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] DPITT: Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006
- Author(s)
  Masayuki Hirose, Einoshin Suzuki
- Journal Title
  
  2006 IEEE International Conference on Granular Computing (IEEE-GrC)
  
  Pages: 538-541
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] DPITT : Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006
- Author(s)
  M.Hirose, E.Suzuki
- Journal Title
  
  2006 IEEE International Conference on Granular Computing (IEEE-GrC)
  
  Pages: 538-541
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Classification non-supervisee de donnees relationnelles2006
- Author(s)
  Jerome Maloberti, Shin Ando, Einoshin Suzuki
- Journal Title
  
  Extraction et Gestion des Connaissances (EGC)
  
  Pages: 389-390
- Related Report
  2005 Annual Research Report
[Journal Article] DPITT : Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006
- Author(s)
  Masayuki Hirose, Einoshin Suzuki
- Journal Title
  
  2006 IEEE International Conference on Granular Computing (IEEE-GrC) (accepted for publication)(5月)
- Related Report
  2005 Annual Research Report
[Journal Article] 最新!データマイニングアルリズム特集編集にあたって2005
- Author(s)
  鈴木英之進, 鹿島久嗣
- Journal Title
  
  情報処理 46・1
  
  Pages: 2-3
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] データスカッシング-逆転の発想によるスケールダウン戦略-2005
- Author(s)
  鈴木英之進
- Journal Title
  
  情報処理 46・1
  
  Pages: 12-19
- NAID
  110002768328
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] Engineering Web Log for Detecting Malicious Sessions to a Web Site by Visual Inspection2005
- Author(s)
  Naoko Hirose, Einoshin Suzuki
- Journal Title
  
  WSEAS Transactions on Computers 10・4
  
  Pages: 1249-1258
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Annual Research Report 2005 Final Research Report Summary
[Journal Article] Detecting Hostile Accesses to a Web Site Using a Visualization Method Based on Probabilistic Clustering2005
- Author(s)
  Naoko Hirose, Einoshin Suzuki
- Journal Title
  
  Proc. Fifth WSEAS International Conference on Simulation, Modeling and Optimization (SMO)
  
  Pages: 596-603
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Mini-Car-Soccer as a Testbed for Granular Computing2005
- Author(s)
  Masanori Yoshinaga, Yukihiro Nakamura, Einoshin Suzuki
- Journal Title
  
  2005 IEEE International Conference on Granular Computing (IEEE GrC-2005) 1
  
  Pages: 92-97
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Annual Research Report 2005 Final Research Report Summary
[Journal Article] Mining Multiple Video Clips of a Soccer Game2005
- Author(s)
  Kenji Aoki, Hiroyuki Mano, Yukihiro Nakamura, Shin Ando, Einoshin Suzuki
- Journal Title
  
  Proc. First International Workshop on Mining Complex Data (MCD)
  
  Pages: 17-24
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Introduction for "The Latest! Data Mining Algorithms"2005
- Author(s)
  E.Suzuki, H.Kashima, Editors'
- Journal Title
  
  IPSJ Magazine 46-1
  
  Pages: 2-3
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Data Squashing - Scale-down Strategy from the Opposite Approach -2005
- Author(s)
  E.Suzuki
- Journal Title
  
  IPSJ Magazine 46-1
  
  Pages: 12-19
- NAID
  110002768328
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Engineering Web Log for Detecting Malicious Sessions to a Web Site by Visual Inspection2005
- Author(s)
  N.Hirose, E.Suzuki
- Journal Title
  
  WSEAS Transactions on Computers 10-4
  
  Pages: 1249-1258
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Detecting Hostile Accesses to a Web Site Using a Visualization Method Based on Probabilistic Clustering2005
- Author(s)
  N.Hirose, Einoshin Suzuki
- Journal Title
  
  Proc.Fifth WSEAS International Conference on Simulation, Modeling and Optimization (SMO)
  
  Pages: 596-603
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Mini-Car-Soccer as a Testbed for Granular Computing2005
- Author(s)
  M.Yoshinaga, Y.Nakamura, E.Suzuki
- Journal Title
  
  2005 IEEE International Conference on Granular Computing (IEEE GrC-2005) 1
  
  Pages: 92-97
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Mining Multiple Video Clips of a Soccer Game2005
- Author(s)
  K.Aoki, H.Mano, Y.Nakamura, S.Ando, E.Suzuki
- Journal Title
  
  Proc.First International Workshop on Mining Complex Data (MCD)
  
  Pages: 17-24
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Classification non-supervisee de donnees relationnelles2005
- Author(s)
  J.Maloberti, S.Ando, E.Suzuki
- Journal Title
  
  Extraction et Gestion des Connaissances (EGC)
  
  Pages: 389-390
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Detecting Hostile Accesses to a Web Site Using a Visualization Method Based on Probabilistic Clustering2005
- Author(s)
  Naoko Hirose, Einoshin Suzuki
- Journal Title
  
  Proc.Fifth WSEAS International Conference on Simulation, Modeling and Optimization (SMO)
  
  Pages: 596-603
- Related Report
  2005 Annual Research Report
[Journal Article] Mining Multiple Video Clips of a Soccer Game2005
- Author(s)
  Kenji Aoki, Hiroyuki Mano, Yukihiro Nakamura, Shin Ando, Einoshin Suzuki
- Journal Title
  
  Proc.First International Workshop on Mining Complex Data (MCD)
  
  Pages: 17-24
- Related Report
  2005 Annual Research Report
[Journal Article] 正確な学習よりも得する学習-誤分類コストを考慮する分類学習-(1)評価編2004
- Author(s)
  鈴木英之進
- Journal Title
  
  情報処理 45・4
  
  Pages: 395-401
- NAID
  110002711350
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] 正確な学習よりも得する学習-誤分類コストを考慮する分類学習-(2)解決編2004
- Author(s)
  鈴木英之進
- Journal Title
  
  情報処理 45・5
  
  Pages: 500-505
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] An Efficient Algorithm for Reducing Clauses Based on Constraint Satisfaction Techniques2004
- Author(s)
  J.Maloberti, E.Suzuki
- Journal Title
  
  Inductive Logic Programming, LNAI (ILP) 3194
  
  Pages: 234-251
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] Using WWW-Distribution of Words in Detecting Peculiar Web Pages2004
- Author(s)
  M.Hirose, E.Suzuki
- Journal Title
  
  Discovery Science, LNAI (DS) 3245
  
  Pages: 355-362
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Journal Article] Profitable Learning Outperforms Accurate Learning - Misclassification-cost-sensitive Learning - (1) Introduction and Evaluation2004
- Author(s)
  E.Suzuki
- Journal Title
  
  IPSJ Magazine 45-4
  
  Pages: 395-401
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Journal Article] Profitable Learning Outperforms Accurate Learning - Misclassification-cost-sensitive Learning - (2) Solutions2004
- Author(s)
  E.Suzuki
- Journal Title
  
  IPSJ Magazine 45-5
  
  Pages: 500-505
- NAID
  110002711368
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary
[Book] Discovery Science, LNAI 3245 (DS)2004
- Author(s)
  E.Suzuki, S.Arikawa (eds.)
- Total Pages
  444
- Publisher
  Springer-Verlag
- Description
  「研究成果報告書概要(和文)」より
- Related Report
  2005 Final Research Report Summary 2004 Annual Research Report
[Book] Discovery Science, LNAI 3245 (DS)2004
- Author(s)
  E.Suzuki, S.Arikawa(eds.)
- Total Pages
  444
- Publisher
  Springer-Verlag
- Description
  「研究成果報告書概要(欧文)」より
- Related Report
  2005 Final Research Report Summary

Data Mining Method for Multi-viewpoint and Multi-granularity Knowledge Discovery

Principal Investigator

SUZUKI Einoshin Yokohama National University, Faculty of Engineering, Associate Professor, 大学院・工学研究院, 助教授 (10251638)

¥14,300,000 (Direct Cost: ¥14,300,000)

Report

Research Products

[Journal Article] Classlficatlon non-supervisee de donnees relationnelles2006

Author(s)

Journal Title

Description

Related Report

[Journal Article] DPITT: Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006

Author(s)

Journal Title

Description

Related Report

[Journal Article] DPITT : Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006

Author(s)

Journal Title

Description

Related Report

[Journal Article] Classification non-supervisee de donnees relationnelles2006

Author(s)

Journal Title

Related Report

[Journal Article] DPITT : Multi-viewpoint Visualization System for Detecting Unexpected WWW Pages Rapidly2006

Author(s)

Journal Title

Related Report

[Journal Article] 最新!データマイニングアルリズム特集 編集にあたって2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] データスカッシング-逆転の発想によるスケールダウン戦略-2005

Author(s)

Journal Title

NAID

Description

Related Report

[Journal Article] Engineering Web Log for Detecting Malicious Sessions to a Web Site by Visual Inspection2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Detecting Hostile Accesses to a Web Site Using a Visualization Method Based on Probabilistic Clustering2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Mini-Car-Soccer as a Testbed for Granular Computing2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Mining Multiple Video Clips of a Soccer Game2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Introduction for "The Latest! Data Mining Algorithms"2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Data Squashing - Scale-down Strategy from the Opposite Approach -2005

Author(s)

Journal Title

NAID

Description

Related Report

[Journal Article] Engineering Web Log for Detecting Malicious Sessions to a Web Site by Visual Inspection2005

Author(s)

Journal Title

Description

Related Report

[Journal Article] Detecting Hostile Accesses to a Web Site Using a Visualization Method Based on Probabilistic Clustering2005

Author(s)

Journal Title

Description

[Journal Article] 最新!データマイニングアルリズム特集編集にあたって2005