• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

文字列集合からの高速パターン抽出アルゴリズムの開発と実働化

研究課題

研究課題/領域番号 14780226
研究種目

若手研究(B)

配分区分補助金
研究分野 計算機科学
研究機関九州大学

研究代表者

篠原 歩  九州大学, 大学院・システム情報科学研究院, 助教授 (00226151)

研究期間 (年度) 2002 – 2004
研究課題ステータス 完了 (2004年度)
配分額 *注記
3,200千円 (直接経費: 3,200千円)
2004年度: 1,100千円 (直接経費: 1,100千円)
2003年度: 1,000千円 (直接経費: 1,000千円)
2002年度: 1,100千円 (直接経費: 1,100千円)
キーワードパターン発見 / データマイニング / 文字列処理 / 探索 / アルゴリズム / データ構造
研究概要

昨年度まで,入力として与えられた文字列集合から,それを特徴付ける一つのパターンを高速に見つけるアルゴリズムの開発をさまざまなパターン族に対して行ってきた.最終年度にあたる本年度は,それをさらに推し進め,複数のパターンの組み合わせによってより柔軟な表現を可能にすることを目指した.当然のことながらこの拡張を行うと,探索空間がさらに広がるために計算時間の増大が問題となる.我々は,接尾辞木を巧妙に活用することによって,与えられた文字列集合を特徴づけるのに最もよいパターン対を効率よく見つけるアルゴリズムの開発に成功した.接尾辞木は,線形サイズとはいえ領域効率があまりよくないため,大規模な文字列に対しては適用しにくくなる.そこで我々は,より領域効率のよい接尾辞配列を用いて接尾辞木を模倣することによって,実装上の観点からも有効なアルゴリズムを与え,計算機実験によってその効果を実証した.また,2つのパターン対の出現する位置の相対距離に関する条件を自由に与えることによって,より表現力を高めたパターン発見問題についても,効率のよいアルゴリズムを与えることができた.さらに,候補となるパターンが与えられた文字列に合致するかどうかを高速に判定するためのデータ構造として,3分木を活用した有向無閉路文字列グラフや,圧縮無閉路文字列グラフについての考察を行った.そしてこの一連のパターン発見問題に関する我々の研究を関連研究と比較しながら総括した.

報告書

(3件)
  • 2004 実績報告書
  • 2003 実績報告書
  • 2002 実績報告書
  • 研究成果

    (14件)

すべて 2005 2004 その他

すべて 雑誌論文 (6件) 文献書誌 (8件)

  • [雑誌論文] On-Line Construction of Compact Directed Acyclic Word Graphs.2005

    • 著者名/発表者名
      Shunsuke Inenaga et al.
    • 雑誌名

      Discrete Applied Mathematics Vol.146, Issue2

      ページ: 156-179

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Ternary directed acyclic word graphs2004

    • 著者名/発表者名
      Satoru Miyamoto et al.
    • 雑誌名

      Theoretical Computer Science Vol.328, Issue1-2

      ページ: 97-111

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] String Pattern Discovery.2004

    • 著者名/発表者名
      Ayumi Shinohara
    • 雑誌名

      Proc.The 15th International Conference Algorithmic Learning Theory (ALT2004) LNAI3244

      ページ: 1-13

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Cooperative and Competing Patterns with Bounded Distance.2004

    • 著者名/発表者名
      Shunsuke Inenaga et al.
    • 雑誌名

      The 7th International Conference on Discovery Science (DS 2004) LNAI3245

      ページ: 32-46

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] Finding Optimal Pairs of Patterns2004

    • 著者名/発表者名
      Hideo Bannai et al.
    • 雑誌名

      Proc.The 4th Workshop on Algorithms in Bioinformatics (WABI 2004) LNB3240

      ページ: 450-452

    • 関連する報告書
      2004 実績報告書
  • [雑誌論文] An O(N^2) Algorithm for Discovering Optimal Boolean Pattern Pairs2004

    • 著者名/発表者名
      Hideo Bannai et al.
    • 雑誌名

      IEEE/ACM Transactions on Computational Biology and Bioinformatics Vol.1, No.4

      ページ: 150-170

    • 関連する報告書
      2004 実績報告書
  • [文献書誌] Masahiro Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. Vol.292. 465-479 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Zdenek Tronicek et al.: "The Size of Subsequence Automaton"Lecture Notes in Computer Science. 2857. 304-310 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] Hideo Bannai et al.: "Inferring Strings from Graphs and Arrays"Lecture Notes in Computer Science. 2747. 208-217 (2003)

    • 関連する報告書
      2003 実績報告書
  • [文献書誌] M.Hirao et al.: "A practical algorithm to find the best subsequences patterns"Theoretical Computer Science. 292(2). 465-479 (2003)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] H.Bannai et al.: "A String Pattern Regression Algorithm and Its Application to Pattern Discovery in Long Introns"Genome Informatics. 13. 3-11 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] S.Inenaga et al.: "Discovering Best Variable-Length-Don't-Care Patterns"Lecture Notes in Artificial Intelligence. 2534. 86-97 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] S.Inenaga et al.: "Space-Economical Construction of Index Structures for All-Suffixes of a String"Lecture Notes in Computer Science. 2534. 86-97 (2002)

    • 関連する報告書
      2002 実績報告書
  • [文献書誌] S.Inenaga et al.: "The Minimum DAWG for All Suffixes of a String and Its Applications"Lecture Notes in Computer Science. 2373. 151-165 (2002)

    • 関連する報告書
      2002 実績報告書

URL: 

公開日: 2002-04-01   更新日: 2016-04-21  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi