• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2008 Fiscal Year Final Research Report

Pattern Discovery from Large Text Data Based on the Property of Languages Being Scale-Free

Research Project

  • PDF
Project/Area Number 19700150
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field Intelligent informatics
Research InstitutionKyushu University

Principal Investigator

IKEDA Daisuke  Kyushu University, 大学院・システム情報科学研究院, 准教授 (00294992)

Project Period (FY) 2007 – 2008
Keywords知識発見とデータマイニング
Research Abstract

本研究の大目標は、スケールフリー性を利用し、言語や対象領域に依存しないテキストマイニングの手法を確立することである。これに対し、可変長の文字列の組み合わせでパターンを発見する手法を2つ提案し、その有効性を実験により示した。最初の手法で用いるパターンは、複数の可変長部分文字列が重複を持って重なっている。この手法により、従来は困難だったワードサラダと呼ばれる人工的に生成されたスパムを検出できるようになった。この手法は、普通の頻度分布と異なる部分を抽出するという意味で従来よく用いられてきた標準正規分布からのずれ(z-score)を用いた手法に近い。一方で、データマイニングの分野で研究されてきた例外パターン発見の枠組みをテキストに応用し、z-scoreでは見つけられなかったパターンを発見できることを、DNA配列を用いた実験により示した。

  • Research Products

    (4 results)

All 2009 2008

All Journal Article (1 results) Presentation (3 results)

  • [Journal Article] Unsupervised Spam Detection by Document Complexity Estimation2008

    • Author(s)
      Takashi Uemura, Daisuke Ikeda and Hiroki Arimura
    • Journal Title

      Proceedings of the llth Inernational Conference on Discovery Science, Lecture Notes in Artificial Intelligence, Springer-Verlag Vol. 5255

      Pages: 319-331

  • [Presentation] 時系列データマイニングによる動的ヘテロなシステムからの知識発見-宇宙天気研究における大規模帰納処理システム構築へ向けて2009

    • Author(s)
      徳永旭将、中村和幸、樋口知之、池田大輔、大久保翔、藤本昌子、吉川顕正、湯元清文、MAGDAS/CPMNグループ湯元清文
    • Organizer
      日本地球惑星科学連合2009年大会
    • Year and Date
      20090500
  • [Presentation] CF-Suffix Trieを用いた頻出移動パターンマイニング手法2009

    • Author(s)
      稲田泰裕,池田大輔,鈴木英之進
    • Organizer
      第9回データマイニングと統計数理研究会
    • Place of Presentation
      京都
    • Year and Date
      2009-03-03
  • [Presentation] Unsupervised Spam Detection by Document Complexity Estimation2008

    • Author(s)
      Takashi Uemura, Daisuke Ikeda and Hiroki Arimura
    • Organizer
      Proceedings of the llth Inernational Conference on Discovery Science, Lecture Notes in Artificial Intelligence, Springer-Verlag
    • Year and Date
      20081000

URL: 

Published: 2010-06-10   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi