• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2015 Fiscal Year Annual Research Report

文字列圧縮に基づく知識発見とデータ分類の研究

Research Project

Project/Area Number 25280086
Research InstitutionKyushu University

Principal Investigator

坂内 英夫  九州大学, システム情報科学研究科(研究院, 准教授 (20323644)

Co-Investigator(Kenkyū-buntansha) 稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
Project Period (FY) 2013-04-01 – 2017-03-31
Keywords文法圧縮 / 省領域アルゴリズム
Outline of Annual Research Achievements

本年度の主な成果は以下の通りである。
1) 文字列の圧縮表現の1つである LZ78 分解を計算する問題について、従来のアルゴリズムは整数アルファベットからなる長さ n の文字列に対しては O(nlog n) 時間必要であったが、新たに O(n) 時間で計算するアルゴリズムを考案した。
2) LZ78 分解/圧縮のアイディアを一般化した LZD (LZ-double) と呼ばれる新しい文法圧縮アルゴリズムを提案した。LZ78 分解が以前に出現する最長の項を見出し、それに続く1文字との連接を新たな項にするのに対し、LZD は以前に出現する最長の項を見出した後、それに続く以前に出現する最長の項を再度見出し、それらの連接を新たな項にするものである。本研究では LZD 計算のための効率の良いアルゴリズムを考案し、更に計算機実験により既存の文法圧縮アルゴリズムと比較して、特に近年増加している高反復文字列に対して、圧縮率が良いこと、また、高速かつ省領域で動作することを示した。
3) 文字列の任意の位置の組に対して、それらの位置で始まる最長の共通部分文字列を求める LCE クエリ問題は文字列処理における基本問題である。従来の劣線形領域アルゴリズムでは長さ n の文字列に対して前処理に O(n^2) 時間必要であった。本研究では前処理時間を大幅に改善し、任意のパラメータ 1≦τ≦n に対して,O(nτ) 時間の前処理で O(n/τ) 領域のデータ構造を構築し、任意の LCE クエリに O(τmin {log τ,log n/τ}) 時間で答える手法を考案した。提案アルゴリズムは使用領域とクエリ時間のトレードオフが最適に近いアルゴリズムの中で、大規模データに対して実用的に使える可能性がある初めての劣線形領域アルゴリズムとなる。

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

昨年度の成果の発展として成果が幾つか得られ,順調に研究が進んでいると言える。

Strategy for Future Research Activity

研究の進捗は順調であり、これまで通りに進める。

Causes of Carryover

6月末に開催される国際会議に本研究の研究成果が受理されたことにより、旅費及び参加費が必要となるため。

Expenditure Plan for Carryover Budget

6月末に開催される国際会議に参加し、研究発表を行うための参加費及び旅費に使用する。

  • Research Products

    (17 results)

All 2016 2015

All Journal Article (10 results) (of which Int'l Joint Research: 5 results,  Peer Reviewed: 10 results,  Acknowledgement Compliant: 1 results) Presentation (7 results) (of which Int'l Joint Research: 7 results)

  • [Journal Article] Deterministic sub-linear space LCE data structures with efficient construction2016

    • Author(s)
      Yuka Tanimura, Tomohiro I, Hideo Bannai, Shunsuke Inenaga, Simon Puglisi, Masayuki Takeda
    • Journal Title

      Proceedings of the 27th Annual Symposium on Combinatorial Pattern Matching (CPM 2016)

      Volume: - Pages: -

    • Peer Reviewed / Int'l Joint Research / Acknowledgement Compliant
  • [Journal Article] Constructing LZ78 tries and position heaps in linear time for large alphabets2015

    • Author(s)
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Information Processing Letters

      Volume: 115(9) Pages: 655-659

    • DOI

      10.1016/j.ipl.2015.04.002

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Compressed automata for dictionary matching2015

    • Author(s)
      Tomohiro I, Takaaki Nishimoto, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Theoretical Computer Science

      Volume: 578 Pages: 30-41

    • DOI

      10.1016/j.tcs.2015.01.019

    • Peer Reviewed
  • [Journal Article] Inferring Strings from Full Abelian Periods2015

    • Author(s)
      Makoto Nishida, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the 26th International Symposium on Algorithms and Computation (ISAAC 2015)

      Volume: LNCS 9472 Pages: 768-779

    • DOI

      10.1007/978-3-662-48971-0_64

    • Peer Reviewed
  • [Journal Article] Efficient Algorithms for Longest Closed Factor Array2015

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto, Tomasz Walen
    • Journal Title

      Proceedings of the 22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)

      Volume: LNCS 9309 Pages: 95-102

    • DOI

      10.1007/978-3-319-23826-5_10

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] A Faster Algorithm for Computing Maximal alpha-gapped Repeats in a String2015

    • Author(s)
      Yuka Tanimura, Yuta Fujishige, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the 22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)

      Volume: LNCS 9309 Pages: 124-136

    • DOI

      10.1007/978-3-319-23826-5_13

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] Computing Left-Right Maximal Generic Words2015

    • Author(s)
      Takaaki Nishimoto, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of The Prague Stringology Conference 2015 (PSC 2015)

      Volume: - Pages: 5-16

    • Peer Reviewed
  • [Journal Article] Semi-dynamic compact index for short patterns and succinct van Emde Boas tree2015

    • Author(s)
      Yoshiaki Matsuoka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the 26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)

      Volume: LNCS 9133 Pages: 355-366

    • DOI

      10.1007/978-3-319-19929-0_30

    • Peer Reviewed / Int'l Joint Research
  • [Journal Article] LZD Factorization: Simple and Practical Online Grammar Compression with Variable-to-Fixed Encoding2015

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda
    • Journal Title

      Proceedings of the 26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)

      Volume: LNCS 9133 Pages: 219-230

    • DOI

      10.1007/978-3-319-19929-0_19

    • Peer Reviewed
  • [Journal Article] An opportunistic text indexing structure based on run length encoding2015

    • Author(s)
      Yuya Tamakoshi, Keisuke Goto, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Journal Title

      Proceedings of the 9th International Conference on Algorithms and Complexity (CIAC 2015)

      Volume: LNCS 9079 Pages: 390-402

    • DOI

      10.1007/978-3-319-18173-8_29

    • Peer Reviewed
  • [Presentation] Inferring Strings from Full Abelian Periods2015

    • Author(s)
      Makoto Nishida, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      26th International Symposium on Algorithms and Computation (ISAAC 2015)
    • Place of Presentation
      名古屋
    • Year and Date
      2015-12-09 – 2015-12-11
    • Int'l Joint Research
  • [Presentation] Efficient Algorithms for Longest Closed Factor Array2015

    • Author(s)
      Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto, Tomasz Walen
    • Organizer
      22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)
    • Place of Presentation
      ロンドン
    • Year and Date
      2015-09-01 – 2015-09-04
    • Int'l Joint Research
  • [Presentation] A Faster Algorithm for Computing Maximal alpha-gapped Repeats in a String2015

    • Author(s)
      Yuka Tanimura, Yuta Fujishige, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)
    • Place of Presentation
      ロンドン
    • Year and Date
      2015-09-01 – 2015-09-04
    • Int'l Joint Research
  • [Presentation] Computing Left-Right Maximal Generic Words2015

    • Author(s)
      Takaaki Nishimoto, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • Organizer
      The Prague Stringology Conference 2015 (PSC 2015)
    • Place of Presentation
      プラハ
    • Year and Date
      2015-08-24 – 2015-08-26
    • Int'l Joint Research
  • [Presentation] Semi-dynamic compact index for short patterns and succinct van Emde Boas tree2015

    • Author(s)
      Yoshiaki Matsuoka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)
    • Place of Presentation
      イスキア
    • Year and Date
      2015-06-29 – 2015-07-01
    • Int'l Joint Research
  • [Presentation] LZD Factorization: Simple and Practical Online Grammar Compression with Variable-to-Fixed Encoding2015

    • Author(s)
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda
    • Organizer
      26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)
    • Place of Presentation
      イスキア
    • Year and Date
      2015-06-29 – 2015-07-01
    • Int'l Joint Research
  • [Presentation] An opportunistic text indexing structure based on run length encoding2015

    • Author(s)
      Yuya Tamakoshi, Keisuke Goto, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • Organizer
      9th International Conference on Algorithms and Complexity (CIAC 2015)
    • Place of Presentation
      パリ
    • Year and Date
      2015-05-20 – 2015-05-22
    • Int'l Joint Research

URL: 

Published: 2017-01-06  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi