• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2012 Fiscal Year Research-status Report

データ圧縮に基づく高速パラメタ化文字列照合技法の開発

Research Project

Project/Area Number 23700022
Research InstitutionKyushu University

Principal Investigator

稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)

Keywordsアルゴリズム / 文字列処理 / データ圧縮
Research Abstract

文字列とは,記号の連鎖のことである.コンピュータ上で取り扱うデータの多くは,文字列とみなすことができる.そのため,文字列データを高速かつ省領域で処理する基盤技術の開発は,情報爆発時代における喫緊の課題となっている.
近年,爆発的に増加した非構造データの集まりを俗にビッグデータと呼ぶようになり,ビッグデータの省領域な格納方法,および有効な活用方法の開発に注目が集まっている.本研究では,データに内在する冗長性を削除し,データの記述長を短縮するデータ圧縮技術を活用する.特に,直線的プログラム(Straight Line Program, SLP)と呼ばれる,単一の文字列のみを導出するチョムスキー標準形の文脈自由文法でデータを圧縮表現する方法に着目した.SLP のサイズを n としたとき,展開文字列長が n に対して指数的に大きくなる場合が存在する.したがって,入力 SLP を陽に展開することなく,様々な処理を n の多項式時間で行うアルゴリズムは,大規模データの省領域な格納と,高速な検索・知識発見に有用である.
今年度は主に,以下の高度な処理を入力 SLP サイズ n の多項式時間で行う手法を開発した.(1) SLP 圧縮文字列が反復文字列(squares)を含むかどうかの判定,(2) SLP 圧縮文字列から LZ78 分解への変換,(3) SLP 圧縮文字列と非圧縮パターンの畳み込みの計算,(4) SLP 圧縮文字列中の全 q グラムの出現頻度の計算.

Current Status of Research Progress
Current Status of Research Progress

1: Research has progressed more than it was originally planned.

Reason

H23年度は,回文照合問題という新たな問題を提案し,それを最適時間で解くアルゴリズムを開発した.また,パラメタ化文字列照合との密接な関係性を明らかにした.また,H24年度には,研究実績の概要の欄でも述べたとおり,SLP で圧縮表現された文字列に対して,様々な処理を高速かつ省領域で行う技術の開発に立て続けに成功しており,当初の計画を上回るものとなっている.

Strategy for Future Research Activity

今後は,研究実績の概要で述べたアルゴリズムのさらなる高速化・省領域化に取り組む.また,より高度な処理を行うことができるように改良を重ねていく予定である.

Expenditure Plans for the Next FY Research Funding

提案手法のさらなる高速化・省領域化の実現ために,当該分野の第一線で活躍する研究者が集う会議に積極的に参加し,最新の研究成果を網羅するとともに,新技術開発のためのディスカッションを行う.このため,国際会議参加や研究打ち合わせを目的として,数度の海外出張を予定している.また,東北大学の共同研究グループとの研究打ち合わせや,国内の会議への参加も積極的に行う予定である.研究成果をまとめるために,計算機や周辺機器の購入も適宜行う予定である.

  • Research Products

    (16 results)

All 2013 2012 Other

All Journal Article (8 results) (of which Peer Reviewed: 8 results) Presentation (6 results) Remarks (2 results)

  • [Journal Article] Permuted Pattern Matching on Multi-Track Strings2013

    • Author(s)
      Takashi Katsura, Kazuyuki Narisawa, Ayumi Shinohara, Hideo Bannai, and Shunsuke Inenaga
    • Journal Title

      In Proc. The 39th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2013), Lecture Notes in Computer Science, (Springer-Verlag)

      Volume: 7741 Pages: 280-291

    • DOI

      10.1007/978-3-642-35843-2_25

    • Peer Reviewed
  • [Journal Article] Fast q-gram mining on SLP compressed strings2013

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga and Masayuki Takeda
    • Journal Title

      Journal of Discrete Algorithms

      Volume: 18 Pages: 89-99

    • DOI

      10.1016/j.jda.2012.07.006

    • Peer Reviewed
  • [Journal Article] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Journal Title

      Proc. Data Compression Conference 2013 (DCC 2013)

      Pages: 451-460

    • Peer Reviewed
  • [Journal Article] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Journal Title

      Proc. Data Compression Conference 2013 (DCC 2013)

      Pages: 143-152

    • Peer Reviewed
  • [Journal Article] An efficient algorithm to test square-freeness of strings compressed by straight-line programs2012

    • Author(s)
      Hideo Bannai, Travis Gagie, Tomohiro I, Shunsuke Inenaga, Gad M. Landau, and Moshe Lewenstein
    • Journal Title

      Information Processing Letters

      Volume: 122(9) Pages: 711-714

    • DOI

      10.1016/j.ipl.2012.06.017

    • Peer Reviewed
  • [Journal Article] The Position Heap of a Trie2012

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Journal Title

      In Proc. the 19th Symposium on String Processing and Information Retrieval (SPIRE 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      Volume: 7608 Pages: 360-371

    • DOI

      10.1007/978-3-642-34109-0_38

    • Peer Reviewed
  • [Journal Article] Efficient LZ78 Factorization of Grammar Compressed Text2012

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Journal Title

      In Proc. the 19th Symposium on String Processing and Information Retrieval (SPIRE 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      Volume: 7608 Pages: 86-98

    • DOI

      10.1007/978-3-642-34109-0_10

    • Peer Reviewed
  • [Journal Article] Speeding-up q-gram mining on grammar-based compressed texts2012

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Journal Title

      In Proc. the 23rd Annual Symposium on Combinatorial Pattern Matching (CPM 2012), Lecture Notes in Computer Science, (Springer-Verlag)

      Volume: 7354 Pages: 220-231

    • DOI

      10.1007/978-3-642-31265-6_18

    • Peer Reviewed
  • [Presentation] Computing convolution on grammar-compressed text2013

    • Author(s)
      Toshiya Tanaka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      Snowbird, Utah
    • Year and Date
      20130320-20130322
  • [Presentation] From Run Length Encoding to LZ78 and Back Again2013

    • Author(s)
      Yuya Tamakoshi, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      Data Compression Conference 2013 (DCC 2013)
    • Place of Presentation
      Snowbird, Utah
    • Year and Date
      20130320-20130320
  • [Presentation] Permuted Pattern Matching on Multi-Track Strings2013

    • Author(s)
      Takashi Katsura, Kazuyuki Narisawa, Ayumi Shinohara, Hideo Bannai, and Shunsuke Inenaga
    • Organizer
      39th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2013)
    • Place of Presentation
      Spindleruv Mlyn, Czech Republic
    • Year and Date
      20130126-31
  • [Presentation] The Position Heap of a Trie2012

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      19th Symposium on String Processing and Information Retrieval (SPIRE 2012)
    • Place of Presentation
      Cartagena de Indias, Colombia
    • Year and Date
      20121021-20121025
  • [Presentation] Efficient LZ78 Factorization of Grammar Compressed Text2012

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Organizer
      19th Symposium on String Processing and Information Retrieval (SPIRE 2012)
    • Place of Presentation
      Cartagena de Indias, Colombia
    • Year and Date
      20121021-20121025
  • [Presentation] Speeding-up q-gram mining on grammar-based compressed texts2012

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, and Masayuki Takeda
    • Organizer
      23rd Annual Symposium on Combinatorial Pattern Matching (CPM 2012)
    • Place of Presentation
      Helsinki, Finland
    • Year and Date
      20120703-05
  • [Remarks] 研究者ホームページ

    • URL

      http://str.i.kyushu-u.ac.jp/~inenaga/index-j.html

  • [Remarks] 九州大学研究者情報

    • URL

      http://hyoka.ofc.kyushu-u.ac.jp/search/details/K003385/index.html

URL: 

Published: 2014-07-24  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi