• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to project page

2022 Fiscal Year Research-status Report

BW変換技術の深化による大規模データ処理基盤技術の開発

Research Project

Project/Area Number 19K20213
Research InstitutionKyushu Institute of Technology

Principal Investigator

井 智弘  九州工業大学, 大学院情報工学研究院, 准教授 (20773360)

Project Period (FY) 2019-04-01 – 2024-03-31
KeywordsBW変換 / 圧縮変換 / 圧縮文字列処理
Outline of Annual Research Achievements

BW変換は文字列中の各文字をその後ろに続く文字列(文脈)によってソートして得られる可逆変換である.それ自体では,文字を並べ替えただけなので圧縮になっていないが,文脈が似通っている文字を隣接する位置に配置することで同じ文字が連続しやすくなるため,連長圧縮などの単純な手法で圧縮することが可能となる.特に,高度反復文字列に対して,BW変換文字列の連長圧縮サイズは非常に小さくなり,データによっては数百分の一のサイズまで大幅に圧縮可能であることが知られている.BW変換は単に圧縮の前処理に止まらず,様々な文字列処理に応用されている.例えば,FerraginaとManziniはBW変換文字列を索引構造のように使えることを示し,文字列を簡潔な領域で保持しながら効率的なパターン照合機能を提供する簡潔データ構造FM-indexを提案した.FM-indexはテキスト中でパタン文字列と完全に一致する部分文字列の位置を検索できるが,完全一致の照合問題を一般化した照合に対してはそのまま使うことはできない.近年,パラメタ化文字列照合に対するFM-indexをはじめとして,様々な一般化文字列照合に対するFM-indexが盛んに研究されている.本年度は,回文構造の一致に基づいた一般化文字列照合に対するFM-indexを提案し,成果をまとめた論文はAnnual Symposium on Combinatorial Pattern Matching 2023に投稿し採択された.この結果は,FM-index的な索引構造を設計するために必要な条件を明らかにするための一助になると考えられる.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究課題に対して成果が得られている.

Strategy for Future Research Activity

引き続き一般化文字列照合に対するFM-indexの設計手法について研究を進める.

Causes of Carryover

年度前半はまだコロナ禍の影響が残っており,旅費の使用が少なかったため.2023年度は渡航制限などが解消され,問題なく使用できると考える.

  • Research Products

    (7 results)

All 2023 2022

All Journal Article (4 results) (of which Int'l Joint Research: 2 results,  Peer Reviewed: 4 results,  Open Access: 2 results) Presentation (3 results) (of which Int'l Joint Research: 3 results)

  • [Journal Article] Longest bordered and periodic subsequences2023

    • Author(s)
      Hideo Bannai, Tomohiro I, Dominik Koeppl
    • Journal Title

      Information Processing Letters

      Volume: 182 Pages: 106398~106398

    • DOI

      10.1016/j.ipl.2023.106398

    • Peer Reviewed / Open Access / Int'l Joint Research
  • [Journal Article] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • Author(s)
      Shinya Nagashita, Tomohiro I
    • Journal Title

      Proc. 34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023

      Volume: - Pages: 23:1-23:15

    • DOI

      10.4230/LIPIcs.CPM.2023.23

    • Peer Reviewed / Open Access
  • [Journal Article] Space-Efficient B Trees via Load-Balancing2022

    • Author(s)
      Tomohiro I, Dominik Koeppl
    • Journal Title

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      Volume: - Pages: 327-340

    • DOI

      10.1007/978-3-031-06678-8_24

    • Peer Reviewed
  • [Journal Article] Computing Longest (Common) Lyndon Subsequences2022

    • Author(s)
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • Journal Title

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      Volume: - Pages: 128-142

    • DOI

      10.1007/978-3-031-06678-8_10

    • Peer Reviewed / Int'l Joint Research
  • [Presentation] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • Author(s)
      Shinya Nagashita, Tomohiro I
    • Organizer
      34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023
    • Int'l Joint Research
  • [Presentation] Space-Efficient B Trees via Load-Balancing2022

    • Author(s)
      Tomohiro I, Dominik Koeppl
    • Organizer
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • Int'l Joint Research
  • [Presentation] Computing Longest (Common) Lyndon Subsequences2022

    • Author(s)
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • Organizer
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • Int'l Joint Research

URL: 

Published: 2023-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi