• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2019 年度 実施状況報告書

BW変換技術の深化による大規模データ処理基盤技術の開発

研究課題

研究課題/領域番号 19K20213
研究機関九州工業大学

研究代表者

井 智弘  九州工業大学, 大学院情報工学研究院, 准教授 (20773360)

研究期間 (年度) 2019-04-01 – 2022-03-31
キーワードBW変換 / 圧縮変換 / 圧縮文字列処理
研究実績の概要

BW変換は文字列中の各文字をその後ろに続く文字列(文脈)によってソートして得られる可逆変換である.それ自体では,文字を並べ替えただけなので圧縮になっていないが,文脈が似通っている文字を隣接する位置に配置することで同じ文字が連続しやすくなるため,連長圧縮などの単純な手法で圧縮することが可能となる.特に,高度反復文字列に対して,BW変換文字列の連長圧縮サイズは非常に小さくなり,データによっては数百分の一のサイズまで大幅に圧縮可能であることが知られている.BW変換は単に圧縮の前処理に止まらず,様々な文字列処理に応用されている.例えば,FerraginaとManziniはBW変換文字列を索引構造のように使えることを示し,文字列を簡潔な領域で保持しながら効率的なパターン照合機能を提供する簡潔データ構造を提案した.近年,BW変換文字列を連長圧縮した領域(RLBWT領域)で索引を実現するデータ構造(r-index)が提案された.本研究ではr-indexの実用性と逐次的な構築の速度を向上させる手法を提案し実装を行った.また,文法圧縮のスケーラビリティを改善する手法を提案した.文法圧縮は圧縮領域でのランダムアクセスがしやすいという利点があるため,RLBWT上での操作と併用することでより豊かな圧縮文字列処理が実現できる.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

RLBWT上の索引に関する研究成果をまとめた論文が国際学術誌 Theoretical Computer Science に掲載された.また,RLBWT から LZ77 圧縮形式に変換する実用的なアルゴリズムの開発および実装に着手した.

今後の研究の推進方策

RLBWT から LZ77 圧縮形式を含む他の圧縮形式に変換する実用的なアルゴリズムの開発および実装に着手する.

次年度使用額が生じた理由

新型コロナウィルスの影響で予定していた出張がキャンセルされたため次年度使用額が生じた.オンラインで開催される会議に参加するために必要な設備購入に充てる.

  • 研究成果

    (5件)

すべて 2020 2019

すべて 雑誌論文 (4件) (うち国際共著 1件、 査読あり 4件) 学会発表 (1件) (うち国際学会 1件)

  • [雑誌論文] Dynamic index and LZ factorization in compressed space2020

    • 著者名/発表者名
      Takaaki Nishimoto, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Discrete Applied Mathematics

      巻: 274 ページ: 116-129

    • DOI

      10.1016/j.dam.2019.01.014

    • 査読あり
  • [雑誌論文] Faster Privacy-Preserving Computation of Edit Distance with Moves2020

    • 著者名/発表者名
      Yohei Yoshimoto, Masaharu Kataoka, Yoshimasa Takabatake, Tomohiro I, Kilho Shin, Hiroshi Sakamoto
    • 雑誌名

      Proc. International Workshop on Algorithms and Computation (WALCOM) 2020

      巻: - ページ: 308-320

    • DOI

      10.1007/978-3-030-39881-1_26

    • 査読あり
  • [雑誌論文] Rpair: Rescaling RePair with Rsync2019

    • 著者名/発表者名
      Travis Gagie, Tomohiro I, Giovanni Manzini, Gonzalo Navarro, Hiroshi Sakamoto, Yoshimasa Takabatake
    • 雑誌名

      Proc. 26th International Symposium on String Processing and Information Retrieval (SPIRE) 2019

      巻: - ページ: 35-44

    • DOI

      10.1007/978-3-030-32686-9_3

    • 査読あり / 国際共著
  • [雑誌論文] k-Abelian Pattern Matching: Revisited, Corrected, and Extended2019

    • 著者名/発表者名
      Golnaz Badkobeh, Hideo Bannai, Maxime Crochemore, Tomohiro I, Shunsuke Inenaga, Shiho Sugimoto
    • 雑誌名

      Proc. Prague Stringology Conference 2019

      巻: - ページ: 29-40

    • 査読あり
  • [学会発表] Rpair: Rescaling RePair with Rsync2019

    • 著者名/発表者名
      Tomohiro I
    • 学会等名
      SPIRE
    • 国際学会

URL: 

公開日: 2021-01-27  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi