• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Annual Research Report

文字列圧縮に基づく文字列パターン発見・文字列データ分類の研究

Research Project

Project/Area Number 22680014
Research InstitutionKyushu University

Principal Investigator

坂内 英夫  九州大学, システム情報科学研究科(研究院, 准教授 (20323644)

Project Period (FY) 2010-04-01 – 2013-03-31
Keywords圧縮文字列処理 / 直線的プログラム
Research Abstract

本年度も単一の文字列を導出するチョムスキー標準形の文脈自由文法である,直線的プログラム (Straight line program, 以下 SLP) によって圧縮表現された文字列を対象に研究を行った.主な成果は以下の通りである.1)長さ N の文字列 T とそれを表現する大きさ n の SLPが与えられたとき,T の長さ q の全部分文字列の情報が,大きさN’ = N - α ≦ N のトライ構造で表現できる(ここで α は q と SLP 表現の圧縮性能に関連した非負整数を表し,N’ ≦ qn が成り立つ),という昨年度得られた成果を応用し,次の2つの成果を得た.A)長さ m のパターン文字列と大きさ N’ の木に対する畳み込みが O(N’ log m) 時間で計算できることを示し,更にこのことにより,パターンと長さ N の文字列との畳み込みの時間計算量を従来の O(N log m) 時間から O(N + N’ log m) 時間に短縮することに成功した.B) SLP で表現された文字列を陽に展開することなく,その LZ78 分解を求めるアルゴリズムを提案した。この成果により,LZ78 を用いた正規化圧縮距離 (NCD) の計算,ひいては NCD に基づくデータの分類などを,圧縮表現のまま効率良く行うことを可能となる.2)連長圧縮表現された文字列を LZ78 分解する効率的なアルゴリズム,また,逆に SLP 表現から連長圧縮表現への変換を高速に行うアルゴリズムを考案した.3)SLP で表現された文字列が,連続して2回出現する部分文字列 (square) を含むかどうかを検証する多項式時間アルゴリズムを考案した.

Current Status of Research Progress
Reason

24年度が最終年度であるため、記入しない。

Strategy for Future Research Activity

24年度が最終年度であるため、記入しない。

  • Research Products

    (10 results)

All 2013 2012

All Journal Article (6 results) (of which Peer Reviewed: 2 results) Presentation (4 results)

  • [Journal Article] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Journal Title

      Proc. Data Compression Conference 2013 (DCC 2013)

      Pages: 143-152

  • [Journal Article] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Journal Title

      Proc. Data Compression Conference 2013 (DCC 2013)

      Pages: 451-460

  • [Journal Article] Fast q-gram mining on SLP compressed strings2013

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Journal Title

      Journal of Discrete Algorithms

      Volume: 18 Pages: 89-99

  • [Journal Article] Simpler and Faster Lempel Ziv Factorization2013

    • Author(s)
      Keisuke Goto and Hideo Bannai
    • Journal Title

      Proc. Data Compression Conference 2013 (DCC 2013)

      Volume: DCC 2013 Pages: 133-142

    • DOI

      10.1109/DCC.2013.21

    • Peer Reviewed
  • [Journal Article] An Efficient Algorithm to Test Square-Freeness of Strings Compressed by Straight-Line Programs2012

    • Author(s)
      Hideo Bannai, Travis Gagie, Tomohiro I, Shunsuke Inenaga, Gad M. Landau, and Moshe Lewenstein
    • Journal Title

      Information Processing Letters

      Volume: 112(19) Pages: 711-714

  • [Journal Article] Efficient LZ78 factorization of grammar compressed text2012

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Journal Title

      Proceedings of the 19th International Symposium on String Processing and Information Retrieval (SPIRE 2012)

      Volume: LNCS 7608 Pages: 86-98

    • DOI

      10.1007/978-3-642-34109-0_10

    • Peer Reviewed
  • [Presentation] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      20130320-20130322
  • [Presentation] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      20130320-20130322
  • [Presentation] Simpler and Faster Lempel Ziv Factorization2013

    • Author(s)
      Keisuke Goto and Hideo Bannai
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      Snowbird, Utah, USA
    • Year and Date
      20130320-20130320
  • [Presentation] Efficient LZ78 factorization of grammar compressed text,2012

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Organizer
      19th International Symposium on String Processing and Information Retrieval (SPIRE 2012)
    • Place of Presentation
      Cartagena, Colombia
    • Year and Date
      20121021-20121025

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi