• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

文字列集合からの高速パターン抽出アルゴリズムの開発と実働化

Research Project

Project/Area Number 14780226
Research Category

Grant-in-Aid for Young Scientists (B)

Allocation TypeSingle-year Grants
Research Field 計算機科学
Research InstitutionKyushu University

Principal Investigator

篠原 歩  九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)

Project Period (FY) 2002 – 2004
Project Status Completed (Fiscal Year 2004)
Budget Amount *help
¥3,200,000 (Direct Cost: ¥3,200,000)
Fiscal Year 2004: ¥1,100,000 (Direct Cost: ¥1,100,000)
Fiscal Year 2003: ¥1,000,000 (Direct Cost: ¥1,000,000)
Fiscal Year 2002: ¥1,100,000 (Direct Cost: ¥1,100,000)
Keywordsパターン発見 / データマイニング / 文字列処理 / 探索 / アルゴリズム / データ構造
Research Abstract

昨年度まで,入力として与えられた文字列集合から,それを特徴付ける一つのパターンを高速に見つけるアルゴリズムの開発をさまざまなパターン族に対して行ってきた.最終年度にあたる本年度は,それをさらに推し進め,複数のパターンの組み合わせによってより柔軟な表現を可能にすることを目指した.当然のことながらこの拡張を行うと,探索空間がさらに広がるために計算時間の増大が問題となる.我々は,接尾辞木を巧妙に活用することによって,与えられた文字列集合を特徴づけるのに最もよいパターン対を効率よく見つけるアルゴリズムの開発に成功した.接尾辞木は,線形サイズとはいえ領域効率があまりよくないため,大規模な文字列に対しては適用しにくくなる.そこで我々は,より領域効率のよい接尾辞配列を用いて接尾辞木を模倣することによって,実装上の観点からも有効なアルゴリズムを与え,計算機実験によってその効果を実証した.また,2つのパターン対の出現する位置の相対距離に関する条件を自由に与えることによって,より表現力を高めたパターン発見問題についても,効率のよいアルゴリズムを与えることができた.さらに,候補となるパターンが与えられた文字列に合致するかどうかを高速に判定するためのデータ構造として,3分木を活用した有向無閉路文字列グラフや,圧縮無閉路文字列グラフについての考察を行った.そしてこの一連のパターン発見問題に関する我々の研究を関連研究と比較しながら総括した.

Report

(3 results)
  • 2004 Annual Research Report
  • 2003 Annual Research Report
  • 2002 Annual Research Report
  • Research Products

    (14 results)

All 2005 2004 Other

All Journal Article (6 results) Publications (8 results)

  • [Journal Article] On-Line Construction of Compact Directed Acyclic Word Graphs.2005

    • Author(s)
      Shunsuke Inenaga et al.
    • Journal Title

      Discrete Applied Mathematics Vol.146, Issue2

      Pages: 156-179

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Ternary directed acyclic word graphs2004

    • Author(s)
      Satoru Miyamoto et al.
    • Journal Title

      Theoretical Computer Science Vol.328, Issue1-2

      Pages: 97-111

    • Related Report
      2004 Annual Research Report
  • [Journal Article] String Pattern Discovery.2004

    • Author(s)
      Ayumi Shinohara
    • Journal Title

      Proc.The 15th International Conference Algorithmic Learning Theory (ALT2004) LNAI3244

      Pages: 1-13

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance.2004

    • Author(s)
      Shunsuke Inenaga et al.
    • Journal Title

      The 7th International Conference on Discovery Science (DS 2004) LNAI3245

      Pages: 32-46

    • Related Report
      2004 Annual Research Report
  • [Journal Article] Finding Optimal Pairs of Patterns2004

    • Author(s)
      Hideo Bannai et al.
    • Journal Title

      Proc.The 4th Workshop on Algorithms in Bioinformatics (WABI 2004) LNB3240

      Pages: 450-452

    • Related Report
      2004 Annual Research Report
  • [Journal Article] An O(N^2) Algorithm for Discovering Optimal Boolean Pattern Pairs2004

    • Author(s)
      Hideo Bannai et al.
    • Journal Title

      IEEE/ACM Transactions on Computational Biology and Bioinformatics Vol.1, No.4

      Pages: 150-170

    • Related Report
      2004 Annual Research Report
  • [Publications] Masahiro Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. Vol.292. 465-479 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Zdenek Tronicek et al.: "The Size of Subsequence Automaton"Lecture Notes in Computer Science. 2857. 304-310 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] Hideo Bannai et al.: "Inferring Strings from Graphs and Arrays"Lecture Notes in Computer Science. 2747. 208-217 (2003)

    • Related Report
      2003 Annual Research Report
  • [Publications] M.Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. 292(2). 465-479 (2003)

    • Related Report
      2002 Annual Research Report
  • [Publications] H.Bannai et al.: "A String Pattern Regression Algorithm and Its Application to Pattern Discovery in Long Introns"Genome Informatics. 13. 3-11 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] S.Inenaga et al.: "Discovering Best Variable-Length-Don't-Care Patterns"Lecture Notes in Artificial Intelligence. 2534. 86-97 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] S.Inenaga et al.: "Space-Economical Construction of Index Structures for All-Suffixes of a String"Lecture Notes in Computer Science. 2534. 86-97 (2002)

    • Related Report
      2002 Annual Research Report
  • [Publications] S.Inenaga et al.: "The Minimum DAWG for All Suffixes of a String and Its Applications"Lecture Notes in Computer Science. 2373. 151-165 (2002)

    • Related Report
      2002 Annual Research Report

URL: 

Published: 2002-04-01   Modified: 2016-04-21  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi