• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

BW変換技術の深化による大規模データ処理基盤技術の開発

研究課題

研究課題/領域番号 19K20213
研究種目

若手研究

配分区分基金
審査区分 小区分60010:情報学基礎論関連
研究機関九州工業大学

研究代表者

井 智弘  九州工業大学, 大学院情報工学研究院, 准教授 (20773360)

研究期間 (年度) 2019-04-01 – 2024-03-31
研究課題ステータス 完了 (2023年度)
配分額 *注記
4,160千円 (直接経費: 3,200千円、間接経費: 960千円)
2021年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2020年度: 1,300千円 (直接経費: 1,000千円、間接経費: 300千円)
2019年度: 1,560千円 (直接経費: 1,200千円、間接経費: 360千円)
キーワード文字列処理 / BW変換 / 圧縮文字列処理 / 圧縮索引 / 一般化文字列照合 / 圧縮変換 / データ圧縮 / 圧縮情報処理 / 文法圧縮 / Burrows-Wheeler変換
研究開始時の研究の概要

Burrows-Wheeler変換(BW変換)は1994年に圧縮のためのデータ変換手法として提案された.BW変換は,後にデータ処理において様々な利点を有していることが判明し,近年も多くの重要な発見がされている.本研究では,BW変換をデータ処理に適した表現への変換技術と位置付け,その根底にあるアイデアを徹底的に追求することで,大規模データ解析の基盤技術を開発する.

研究成果の概要

BW変換は文字列中の各文字をその後ろに続く文字列(文脈)によってソートして得られる可逆変換であり,文字列圧縮や圧縮文字列処理に利用されている.本研究の主な成果は以下の通りである.(1) BW変換文字列を連長圧縮した領域(RLBWT領域)で索引を実現するデータ構造(r-index)の実用性と逐次的な構築の速度を向上させた.(2) RLBWTからLZ77圧縮形式に変換する実用的なアルゴリズムを開発した.(3) 回文照合問題に対するBW変換に基づいた索引を開発した.(4) パラメタ化文字列照合に対するBW変換に基づいた索引を効率的に構築する手法を開発した.

研究成果の学術的意義や社会的意義

データ処理において,データをどのように表現するかは処理の効率に大きく関わる最重要かつ根源的な問題である.圧縮のためのデータ変換手法として提案されたBurrows-Wheeler変換(BW変換)は,後の研究によりデータ処理において様々な利点を有していることが明らかになっている.本研究は,BW変換文字列を連長圧縮した領域で動作するアルゴリズムや一般化文字列照合におけるBW変換の応用技術の発展に寄与した.

報告書

(6件)
  • 2023 実績報告書   研究成果報告書 ( PDF )
  • 2022 実施状況報告書
  • 2021 実施状況報告書
  • 2020 実施状況報告書
  • 2019 実施状況報告書
  • 研究成果

    (26件)

すべて 2024 2023 2022 2021 2020 2019

すべて 雑誌論文 (16件) (うち国際共著 9件、 査読あり 16件、 オープンアクセス 5件) 学会発表 (10件) (うち国際学会 10件)

  • [雑誌論文] Computing Longest Lyndon Subsequences and Longest Common Lyndon Subsequences2024

    • 著者名/発表者名
      Hideo Bannai and Tomohiro I and Tomasz Kociumaka and Dominik Koeppl and Simon J. Puglisi
    • 雑誌名

      Algorithmica

      巻: 86 号: 3 ページ: 735-756

    • DOI

      10.1007/s00453-023-01125-z

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] On the Hardness of Smallest RLSLPs and Collage Systems2024

    • 著者名/発表者名
      Akiyoshi Kawamoto, Tomohiro I, Dominik Koeppl, Hideo Bannai
    • 雑誌名

      Proc. Data Compression Conference (DCC) 2024

      巻: - ページ: 243-252

    • 関連する報告書
      2023 実績報告書
    • 査読あり
  • [雑誌論文] Breaking a Barrier in Constructing Compact Indexes for Parameterized Pattern Matching2024

    • 著者名/発表者名
      Kento Iseri, Tomohiro I, Diptarama Hendrian, Dominik Koeppl, Ryo Yoshinaka, Ayumi Shinohara
    • 雑誌名

      Proc. 51st International Colloquium on Automata, Languages, and Programming (ICALP) 2024

      巻: -

    • 関連する報告書
      2023 実績報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Longest bordered and periodic subsequences2023

    • 著者名/発表者名
      Hideo Bannai and Tomohiro I and Dominik Koeppl
    • 雑誌名

      Inf. Process. Lett.

      巻: 182 ページ: 1-6

    • DOI

      10.1016/j.ipl.2023.106398

    • 関連する報告書
      2023 実績報告書 2022 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • 著者名/発表者名
      Shinya Nagashita, Tomohiro I
    • 雑誌名

      Proc. 34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023

      巻: -

    • 関連する報告書
      2023 実績報告書 2022 実施状況報告書
    • 査読あり / オープンアクセス
  • [雑誌論文] Space-Efficient B Trees via Load-Balancing2022

    • 著者名/発表者名
      Tomohiro I, Dominik Koeppl
    • 雑誌名

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      巻: - ページ: 327-340

    • DOI

      10.1007/978-3-031-06678-8_24

    • ISBN
      9783031066771, 9783031066788
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Computing Longest (Common) Lyndon Subsequences2022

    • 著者名/発表者名
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • 雑誌名

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      巻: - ページ: 128-142

    • DOI

      10.1007/978-3-031-06678-8_10

    • ISBN
      9783031066771, 9783031066788
    • 関連する報告書
      2022 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Converting RLBWT to LZ77 in smaller space2022

    • 著者名/発表者名
      Masaki Shigekuni, Tomohiro I
    • 雑誌名

      IEEE Computer Society Press CPS Online

      巻: - ページ: 242-251

    • 関連する報告書
      2021 実施状況報告書
    • 査読あり
  • [雑誌論文] PHONI: Streamed Matching Statistics with Multi-genome References2021

    • 著者名/発表者名
      Christina Boucher, Travis Gagie, Tomohiro I, Dominik Koeppl, Ben Langmead, Giovanni Manzini, Gonzalo Navarro, Alejandro Pacheco, Massimiliano Rossi
    • 雑誌名

      Proc. Data Compression Conference (DCC) 2021

      巻: - ページ: 193-202

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Deterministic Sparse Suffix Sorting in the Restore Model2020

    • 著者名/発表者名
      Johannes Fischer, Tomohiro I, Dominik Koeppl
    • 雑誌名

      ACM Transactions on Algorithms

      巻: 16(4) 号: 4 ページ: 1-53

    • DOI

      10.1145/3398681

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl, Tomohiro I, Isamu Furuya, Yoshimasa Takabatake, Kensuke Sakai, Keisuke Goto,
    • 雑誌名

      Algorithms

      巻: 14(1) 号: 1 ページ: 1-20

    • DOI

      10.3390/a14010005

    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] Practical Random Access to SLP-Compressed Texts2020

    • 著者名/発表者名
      Travis Gagie, Tomohiro I, Giovanni Manzini, Gonzalo Navarro, Hiroshi Sakamoto, Louisa Seelbach Benkner, Yoshimasa Takabatake,
    • 雑誌名

      Proc. 27th International Symposium on String Processing and Information Retrieval (SPIRE) 2020

      巻: - ページ: 221-231

    • DOI

      10.1007/978-3-030-59212-7_16

    • ISBN
      9783030592110, 9783030592127
    • 関連する報告書
      2020 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] Dynamic index and LZ factorization in compressed space2020

    • 著者名/発表者名
      Takaaki Nishimoto, Tomohiro I, Shunsuke Inenaga, Hideo Bannai, Masayuki Takeda
    • 雑誌名

      Discrete Applied Mathematics

      巻: 274 ページ: 116-129

    • DOI

      10.1016/j.dam.2019.01.014

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Faster Privacy-Preserving Computation of Edit Distance with Moves2020

    • 著者名/発表者名
      Yohei Yoshimoto, Masaharu Kataoka, Yoshimasa Takabatake, Tomohiro I, Kilho Shin, Hiroshi Sakamoto
    • 雑誌名

      Proc. International Workshop on Algorithms and Computation (WALCOM) 2020

      巻: - ページ: 308-320

    • DOI

      10.1007/978-3-030-39881-1_26

    • ISBN
      9783030398804, 9783030398811
    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [雑誌論文] Rpair: Rescaling RePair with Rsync2019

    • 著者名/発表者名
      Travis Gagie, Tomohiro I, Giovanni Manzini, Gonzalo Navarro, Hiroshi Sakamoto, Yoshimasa Takabatake
    • 雑誌名

      Proc. 26th International Symposium on String Processing and Information Retrieval (SPIRE) 2019

      巻: - ページ: 35-44

    • DOI

      10.1007/978-3-030-32686-9_3

    • ISBN
      9783030326852, 9783030326869
    • 関連する報告書
      2019 実施状況報告書
    • 査読あり / 国際共著
  • [雑誌論文] k-Abelian Pattern Matching: Revisited, Corrected, and Extended2019

    • 著者名/発表者名
      Golnaz Badkobeh, Hideo Bannai, Maxime Crochemore, Tomohiro I, Shunsuke Inenaga, Shiho Sugimoto
    • 雑誌名

      Proc. Prague Stringology Conference 2019

      巻: - ページ: 29-40

    • 関連する報告書
      2019 実施状況報告書
    • 査読あり
  • [学会発表] On the Hardness of Smallest RLSLPs and Collage Systems2024

    • 著者名/発表者名
      Akiyoshi Kawamoto, Tomohiro I, Dominik Koeppl, Hideo Bannai
    • 学会等名
      Data Compression Conference (DCC) 2024
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • 著者名/発表者名
      Shinya Nagashita and Tomohiro I
    • 学会等名
      34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023
    • 関連する報告書
      2023 実績報告書
    • 国際学会
  • [学会発表] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • 著者名/発表者名
      Shinya Nagashita, Tomohiro I
    • 学会等名
      34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Space-Efficient B Trees via Load-Balancing2022

    • 著者名/発表者名
      Tomohiro I, Dominik Koeppl
    • 学会等名
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Computing Longest (Common) Lyndon Subsequences2022

    • 著者名/発表者名
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • 学会等名
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • 関連する報告書
      2022 実施状況報告書
    • 国際学会
  • [学会発表] Converting RLBWT to LZ77 in smaller space2022

    • 著者名/発表者名
      Masaki Shigekuni, Tomohiro I
    • 学会等名
      Data Compression Conference 2022
    • 関連する報告書
      2021 実施状況報告書
    • 国際学会
  • [学会発表] PHONI: Streamed Matching Statistics with Multi-genome References2021

    • 著者名/発表者名
      Christina Boucher, Travis Gagie, Tomohiro I, Dominik Koeppl, Ben Langmead, Giovanni Manzini, Gonzalo Navarro, Alejandro Pacheco, Massimiliano Rossi
    • 学会等名
      Data Compression Conference (DCC) 2021
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Re-Pair in Small Space2020

    • 著者名/発表者名
      Dominik Koeppl, Tomohiro I, Isamu Furuya, Yoshimasa Takabatake, Kensuke Sakai, Keisuke Goto
    • 学会等名
      Prague Stringology Conference (PSC) 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Practical Random Access to SLP-Compressed Texts2020

    • 著者名/発表者名
      Travis Gagie, Tomohiro I, Giovanni Manzini, Gonzalo Navarro, Hiroshi Sakamoto, Louisa Seelbach Benkner, Yoshimasa Takabatake
    • 学会等名
      27th International Symposium on String Processing and Information Retrieval (SPIRE) 2020
    • 関連する報告書
      2020 実施状況報告書
    • 国際学会
  • [学会発表] Rpair: Rescaling RePair with Rsync2019

    • 著者名/発表者名
      Tomohiro I
    • 学会等名
      SPIRE
    • 関連する報告書
      2019 実施状況報告書
    • 国際学会

URL: 

公開日: 2019-04-18   更新日: 2025-01-30  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi