• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2015 年度 実績報告書

文字列圧縮に基づく知識発見とデータ分類の研究

研究課題

研究課題/領域番号 25280086
研究機関九州大学

研究代表者

坂内 英夫  九州大学, システム情報科学研究科(研究院, 准教授 (20323644)

研究分担者 稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
研究期間 (年度) 2013-04-01 – 2017-03-31
キーワード文法圧縮 / 省領域アルゴリズム
研究実績の概要

本年度の主な成果は以下の通りである。
1) 文字列の圧縮表現の1つである LZ78 分解を計算する問題について、従来のアルゴリズムは整数アルファベットからなる長さ n の文字列に対しては O(nlog n) 時間必要であったが、新たに O(n) 時間で計算するアルゴリズムを考案した。
2) LZ78 分解/圧縮のアイディアを一般化した LZD (LZ-double) と呼ばれる新しい文法圧縮アルゴリズムを提案した。LZ78 分解が以前に出現する最長の項を見出し、それに続く1文字との連接を新たな項にするのに対し、LZD は以前に出現する最長の項を見出した後、それに続く以前に出現する最長の項を再度見出し、それらの連接を新たな項にするものである。本研究では LZD 計算のための効率の良いアルゴリズムを考案し、更に計算機実験により既存の文法圧縮アルゴリズムと比較して、特に近年増加している高反復文字列に対して、圧縮率が良いこと、また、高速かつ省領域で動作することを示した。
3) 文字列の任意の位置の組に対して、それらの位置で始まる最長の共通部分文字列を求める LCE クエリ問題は文字列処理における基本問題である。従来の劣線形領域アルゴリズムでは長さ n の文字列に対して前処理に O(n^2) 時間必要であった。本研究では前処理時間を大幅に改善し、任意のパラメータ 1≦τ≦n に対して,O(nτ) 時間の前処理で O(n/τ) 領域のデータ構造を構築し、任意の LCE クエリに O(τmin {log τ,log n/τ}) 時間で答える手法を考案した。提案アルゴリズムは使用領域とクエリ時間のトレードオフが最適に近いアルゴリズムの中で、大規模データに対して実用的に使える可能性がある初めての劣線形領域アルゴリズムとなる。

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

昨年度の成果の発展として成果が幾つか得られ,順調に研究が進んでいると言える。

今後の研究の推進方策

研究の進捗は順調であり、これまで通りに進める。

次年度使用額が生じた理由

6月末に開催される国際会議に本研究の研究成果が受理されたことにより、旅費及び参加費が必要となるため。

次年度使用額の使用計画

6月末に開催される国際会議に参加し、研究発表を行うための参加費及び旅費に使用する。

  • 研究成果

    (17件)

すべて 2016 2015

すべて 雑誌論文 (10件) (うち国際共著 5件、 査読あり 10件、 謝辞記載あり 1件) 学会発表 (7件) (うち国際学会 7件)

  • [雑誌論文] Deterministic sub-linear space LCE data structures with efficient construction2016

    • 著者名/発表者名
      Yuka Tanimura, Tomohiro I, Hideo Bannai, Shunsuke Inenaga, Simon Puglisi, Masayuki Takeda
    • 雑誌名

      Proceedings of the 27th Annual Symposium on Combinatorial Pattern Matching (CPM 2016)

      巻: - ページ: -

    • 査読あり / 国際共著 / 謝辞記載あり
  • [雑誌論文] Constructing LZ78 tries and position heaps in linear time for large alphabets2015

    • 著者名/発表者名
      Yuto Nakashima, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Information Processing Letters

      巻: 115(9) ページ: 655-659

    • DOI

      10.1016/j.ipl.2015.04.002

    • 査読あり / 国際共著
  • [雑誌論文] Compressed automata for dictionary matching2015

    • 著者名/発表者名
      Tomohiro I, Takaaki Nishimoto, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Theoretical Computer Science

      巻: 578 ページ: 30-41

    • DOI

      10.1016/j.tcs.2015.01.019

    • 査読あり
  • [雑誌論文] Inferring Strings from Full Abelian Periods2015

    • 著者名/発表者名
      Makoto Nishida, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the 26th International Symposium on Algorithms and Computation (ISAAC 2015)

      巻: LNCS 9472 ページ: 768-779

    • DOI

      10.1007/978-3-662-48971-0_64

    • 査読あり
  • [雑誌論文] Efficient Algorithms for Longest Closed Factor Array2015

    • 著者名/発表者名
      Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto, Tomasz Walen
    • 雑誌名

      Proceedings of the 22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)

      巻: LNCS 9309 ページ: 95-102

    • DOI

      10.1007/978-3-319-23826-5_10

    • 査読あり / 国際共著
  • [雑誌論文] A Faster Algorithm for Computing Maximal alpha-gapped Repeats in a String2015

    • 著者名/発表者名
      Yuka Tanimura, Yuta Fujishige, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the 22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)

      巻: LNCS 9309 ページ: 124-136

    • DOI

      10.1007/978-3-319-23826-5_13

    • 査読あり / 国際共著
  • [雑誌論文] Computing Left-Right Maximal Generic Words2015

    • 著者名/発表者名
      Takaaki Nishimoto, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of The Prague Stringology Conference 2015 (PSC 2015)

      巻: - ページ: 5-16

    • 査読あり
  • [雑誌論文] Semi-dynamic compact index for short patterns and succinct van Emde Boas tree2015

    • 著者名/発表者名
      Yoshiaki Matsuoka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the 26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)

      巻: LNCS 9133 ページ: 355-366

    • DOI

      10.1007/978-3-319-19929-0_30

    • 査読あり / 国際共著
  • [雑誌論文] LZD Factorization: Simple and Practical Online Grammar Compression with Variable-to-Fixed Encoding2015

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda
    • 雑誌名

      Proceedings of the 26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)

      巻: LNCS 9133 ページ: 219-230

    • DOI

      10.1007/978-3-319-19929-0_19

    • 査読あり
  • [雑誌論文] An opportunistic text indexing structure based on run length encoding2015

    • 著者名/発表者名
      Yuya Tamakoshi, Keisuke Goto, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proceedings of the 9th International Conference on Algorithms and Complexity (CIAC 2015)

      巻: LNCS 9079 ページ: 390-402

    • DOI

      10.1007/978-3-319-18173-8_29

    • 査読あり
  • [学会発表] Inferring Strings from Full Abelian Periods2015

    • 著者名/発表者名
      Makoto Nishida, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      26th International Symposium on Algorithms and Computation (ISAAC 2015)
    • 発表場所
      名古屋
    • 年月日
      2015-12-09 – 2015-12-11
    • 国際学会
  • [学会発表] Efficient Algorithms for Longest Closed Factor Array2015

    • 著者名/発表者名
      Hideo Bannai, Shunsuke Inenaga, Tomasz Kociumaka, Arnaud Lefebvre, Jakub Radoszewski, Wojciech Rytter, Shiho Sugimoto, Tomasz Walen
    • 学会等名
      22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)
    • 発表場所
      ロンドン
    • 年月日
      2015-09-01 – 2015-09-04
    • 国際学会
  • [学会発表] A Faster Algorithm for Computing Maximal alpha-gapped Repeats in a String2015

    • 著者名/発表者名
      Yuka Tanimura, Yuta Fujishige, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      22nd International Symposium on String Processing and Information Retrieval (SPIRE 2015)
    • 発表場所
      ロンドン
    • 年月日
      2015-09-01 – 2015-09-04
    • 国際学会
  • [学会発表] Computing Left-Right Maximal Generic Words2015

    • 著者名/発表者名
      Takaaki Nishimoto, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 学会等名
      The Prague Stringology Conference 2015 (PSC 2015)
    • 発表場所
      プラハ
    • 年月日
      2015-08-24 – 2015-08-26
    • 国際学会
  • [学会発表] Semi-dynamic compact index for short patterns and succinct van Emde Boas tree2015

    • 著者名/発表者名
      Yoshiaki Matsuoka, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)
    • 発表場所
      イスキア
    • 年月日
      2015-06-29 – 2015-07-01
    • 国際学会
  • [学会発表] LZD Factorization: Simple and Practical Online Grammar Compression with Variable-to-Fixed Encoding2015

    • 著者名/発表者名
      Keisuke Goto, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda
    • 学会等名
      26th Annual Symposium on Combinatorial Pattern Matching (CPM 2015)
    • 発表場所
      イスキア
    • 年月日
      2015-06-29 – 2015-07-01
    • 国際学会
  • [学会発表] An opportunistic text indexing structure based on run length encoding2015

    • 著者名/発表者名
      Yuya Tamakoshi, Keisuke Goto, Shunsuke Inenaga, Hideo Bannai, and Masayuki Takeda
    • 学会等名
      9th International Conference on Algorithms and Complexity (CIAC 2015)
    • 発表場所
      パリ
    • 年月日
      2015-05-20 – 2015-05-22
    • 国際学会

URL: 

公開日: 2017-01-06  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi