• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2013 年度 実績報告書

文字列圧縮に基づく知識発見とデータ分類の研究

研究課題

研究課題/領域番号 25280086
研究種目

基盤研究(B)

研究機関九州大学

研究代表者

坂内 英夫  九州大学, システム情報科学研究科(研究院, 准教授 (20323644)

研究分担者 稲永 俊介  九州大学, システム情報科学研究科(研究院, 准教授 (60448404)
研究期間 (年度) 2013-04-01 – 2016-03-31
キーワード圧縮文字列処理 / SLP / LZ 分解
研究概要

本年度は主に直線的プログラム (Straight Line Program - SLP) という文字列の圧縮表現を対象にし,様々な問題について圧縮表現を陽に展開する事なく,効率良く処理するアルゴリズムの開発に取り組み,以下の成果が得られた.
1) 圧縮表現された文字列の繰り返し構造発見問題に対して,これまでは連続して2回出現する部分文字列 (square) が存在するかどうかを検出するアルゴリズムしか存在しなかったが,本研究ではより一般化した極大繰り返し構造 (run) の検出、更には数え上げを行う初の多項式時間アルゴリズムを提案した.2) 圧縮表現された文字列の Lyndon 分解を求める問題に対して、初の多項式時間アルゴリズムを提案した.また,文字列の Lyndon 分解のサイズがその文字列を表現する任意の SLP のサイズの下界であるという理論的に興味深い知見が得られた.3) 圧縮表現された文字列の LZ78 分解を求めるアルゴリズムについて,これまで O(n sqrt{N} + m log N) 時間のアルゴリズムが知られていたが、本研究では O(n + m log m) 時間のアルゴリズムが得られた.ここで, n は SLP のサイズ, m は LZ78 分解のサイズ,N は SLP が表現する非圧縮文字列の長さである.
更に,与えられた文字列を表現する小さな SLP を得るために重要な LZ77 分解問題に関して,高速かつ省領域なアルゴリズムの開発を行った.本研究では、アルファベットサイズ σ が小さいときに、線形時間で動作する LZ77 分解アルゴリズムの中で最も省領域となる N log N + O(σ log N) ビット領域で動作するアルゴリズムの開発に成功した.また,新しい文字が次々に追加されるオンライン LZ77 分解問題に対して,O(N log σ) ビット領域のみを使用したアルゴリズムの中で最も高速となる O(N log N) 時間アルゴリズムを開発する事に成功した.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

極大繰り返し構造の発見・列挙アルゴリズムの開発に成功したのをはじめ,幾つかの重要な文字列処理問題に対して圧縮文字列処理のアプローチの導入を行う事ができており,順調に研究が進んでいると言える.

今後の研究の推進方策

研究の進捗は順調であり、これまで通りに進めるとともに、今後は実際のデータへの適用を視野に入れた検討を行う.

次年度の研究費の使用計画

本年度は成果が多く出たため、成果発表の予算を優先した.残額では十分な性能の計算機の購入が難しいため、翌年度の予算と合わせて購入することとした。
計算機実験等に使用するための計算機を購入する。

  • 研究成果

    (12件)

すべて 2014 2013

すべて 雑誌論文 (9件) (うち査読あり 9件) 学会発表 (3件)

  • [雑誌論文] Shortest Unique Substrings Queries in Optimal Time2014

    • 著者名/発表者名
      Kazuya Tsuruta, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proc. 40th International Conference on Current Trends in Theory and Practice of Computer Science (SOFSEM 2014)

      巻: LNCS 8327 ページ: 503-513

    • DOI

      10.1007/978-3-319-04298-5_44

    • 査読あり
  • [雑誌論文] Faster Compact On-Line Lempel-Ziv Factorization2014

    • 著者名/発表者名
      Jun'ichi Yamamoto, Tomohiro I, Hideo Bannai, Shunsuke Inenaga, Masayuki Takeda
    • 雑誌名

      Proc. 31st Symposium on Theoretical Aspects of Computer Science (STACS 2014)

      巻: LIPIcs 25 ページ: 675-686

    • DOI

      10.4230/LIPIcs.STACS.2014.675

    • 査読あり
  • [雑誌論文] Space Efficient Linear Time Lempel-Ziv Factorization for Small Alphabets2014

    • 著者名/発表者名
      Keisuke Goto and Hideo Bannai
    • 雑誌名

      Proc. Data Compression Conference 2014 (DCC 2014)

      巻: DCC2014 ページ: 163-172

    • DOI

      10.1109/DCC.2014.62

    • 査読あり
  • [雑誌論文] Efficient Lyndon factorization of grammar compressed text2013

    • 著者名/発表者名
      Tomohiro I, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proc. 24th Annual Symposium on Combinatorial Pattern Matching (CPM 2013)

      巻: LNCS 7922 ページ: 153-164

    • DOI

      10.1007/978-3-642-38905-4_16

    • 査読あり
  • [雑誌論文] Converting SLP to LZ78 in almost linear time2013

    • 著者名/発表者名
      Hideo Bannai, Pawel Gawrychowski, Shunsuke Inenaga, Masayuki Takeda,
    • 雑誌名

      Proc. 24th Annual Symposium on Combinatorial Pattern Matching (CPM 2013)

      巻: LNCS 7922 ページ: 38-49

    • DOI

      10.1007/978-3-642-38905-4_6

    • 査読あり
  • [雑誌論文] Compressed Automata for Dictionary Matching2013

    • 著者名/発表者名
      Tomohiro I, Takaaki Nishimoto, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proc. 18th International Conference on Implementation and Application of Automata (CIAA 2013)

      巻: LNCS 7982 ページ: 319-330

    • DOI

      10.1007/978-3-642-39274-0_28

    • 査読あり
  • [雑誌論文] Detecting regularities on grammar-compressed strings2013

    • 著者名/発表者名
      Tomohiro I, Wataru Matsubara, Kouji Shimohira, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda, Kazuyuki Narisawa, Ayumi Shinohara
    • 雑誌名

      Proc. 38th International Symposium on Mathematical Foundations of Computer Science (MFCS 2013)

      巻: LNCS 8087 ページ: 571-582

    • DOI

      10.1007/978-3-642-40313-2_51

    • 査読あり
  • [雑誌論文] Computing Reversed Lempel-Ziv Factorization Online2013

    • 著者名/発表者名
      Shiho Sugimoto, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proc. The Prague Stringology Conference 2013 (PSC 2013)

      巻: PSC2013 ページ: 107-118

    • 査読あり
  • [雑誌論文] Faster Lyndon factorization algorithms for SLP and LZ78 compressed text2013

    • 著者名/発表者名
      Tomohiro I, Yuto Nakashima, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Proc. 20th International Symposium on String Processing and Information Retrieval (SPIRE 2013)

      巻: LNCS 8214 ページ: 174-185

    • DOI

      10.1007/978-3-319-02432-5_21

    • 査読あり
  • [学会発表] 省スペースオンラインLZ分解2014

    • 著者名/発表者名
      井 智弘
    • 学会等名
      2013 冬の LA シンポジウム
    • 発表場所
      京都
    • 年月日
      20140128-20140130
  • [学会発表] 動的でコンパクトな索引構造2014

    • 著者名/発表者名
      松岡 禎明
    • 学会等名
      2013 冬の LA シンポジウム
    • 発表場所
      京都
    • 年月日
      20140128-20140130
  • [学会発表] 高速かつ省領域な線形時間LZ分解アルゴリズム2013

    • 著者名/発表者名
      後藤啓介
    • 学会等名
      第145回アルゴリズム研究会
    • 発表場所
      花巻
    • 年月日
      20131106-20131107

URL: 

公開日: 2015-05-28  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi