• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 課題ページに戻る

2022 年度 実施状況報告書

BW変換技術の深化による大規模データ処理基盤技術の開発

研究課題

研究課題/領域番号 19K20213
研究機関九州工業大学

研究代表者

井 智弘  九州工業大学, 大学院情報工学研究院, 准教授 (20773360)

研究期間 (年度) 2019-04-01 – 2024-03-31
キーワードBW変換 / 圧縮変換 / 圧縮文字列処理
研究実績の概要

BW変換は文字列中の各文字をその後ろに続く文字列(文脈)によってソートして得られる可逆変換である.それ自体では,文字を並べ替えただけなので圧縮になっていないが,文脈が似通っている文字を隣接する位置に配置することで同じ文字が連続しやすくなるため,連長圧縮などの単純な手法で圧縮することが可能となる.特に,高度反復文字列に対して,BW変換文字列の連長圧縮サイズは非常に小さくなり,データによっては数百分の一のサイズまで大幅に圧縮可能であることが知られている.BW変換は単に圧縮の前処理に止まらず,様々な文字列処理に応用されている.例えば,FerraginaとManziniはBW変換文字列を索引構造のように使えることを示し,文字列を簡潔な領域で保持しながら効率的なパターン照合機能を提供する簡潔データ構造FM-indexを提案した.FM-indexはテキスト中でパタン文字列と完全に一致する部分文字列の位置を検索できるが,完全一致の照合問題を一般化した照合に対してはそのまま使うことはできない.近年,パラメタ化文字列照合に対するFM-indexをはじめとして,様々な一般化文字列照合に対するFM-indexが盛んに研究されている.本年度は,回文構造の一致に基づいた一般化文字列照合に対するFM-indexを提案し,成果をまとめた論文はAnnual Symposium on Combinatorial Pattern Matching 2023に投稿し採択された.この結果は,FM-index的な索引構造を設計するために必要な条件を明らかにするための一助になると考えられる.

現在までの達成度 (区分)
現在までの達成度 (区分)

2: おおむね順調に進展している

理由

研究課題に対して成果が得られている.

今後の研究の推進方策

引き続き一般化文字列照合に対するFM-indexの設計手法について研究を進める.

次年度使用額が生じた理由

年度前半はまだコロナ禍の影響が残っており,旅費の使用が少なかったため.2023年度は渡航制限などが解消され,問題なく使用できると考える.

  • 研究成果

    (7件)

すべて 2023 2022

すべて 雑誌論文 (4件) (うち国際共著 2件、 査読あり 4件、 オープンアクセス 2件) 学会発表 (3件) (うち国際学会 3件)

  • [雑誌論文] Longest bordered and periodic subsequences2023

    • 著者名/発表者名
      Hideo Bannai, Tomohiro I, Dominik Koeppl
    • 雑誌名

      Information Processing Letters

      巻: 182 ページ: 106398~106398

    • DOI

      10.1016/j.ipl.2023.106398

    • 査読あり / オープンアクセス / 国際共著
  • [雑誌論文] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • 著者名/発表者名
      Shinya Nagashita, Tomohiro I
    • 雑誌名

      Proc. 34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023

      巻: - ページ: 23:1-23:15

    • DOI

      10.4230/LIPIcs.CPM.2023.23

    • 査読あり / オープンアクセス
  • [雑誌論文] Space-Efficient B Trees via Load-Balancing2022

    • 著者名/発表者名
      Tomohiro I, Dominik Koeppl
    • 雑誌名

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      巻: - ページ: 327-340

    • DOI

      10.1007/978-3-031-06678-8_24

    • 査読あり
  • [雑誌論文] Computing Longest (Common) Lyndon Subsequences2022

    • 著者名/発表者名
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • 雑誌名

      Proc. 33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022

      巻: - ページ: 128-142

    • DOI

      10.1007/978-3-031-06678-8_10

    • 査読あり / 国際共著
  • [学会発表] PalFM-index: FM-index for Palindrome Pattern Matching2023

    • 著者名/発表者名
      Shinya Nagashita, Tomohiro I
    • 学会等名
      34th Annual Symposium on Combinatorial Pattern Matching (CPM) 2023
    • 国際学会
  • [学会発表] Space-Efficient B Trees via Load-Balancing2022

    • 著者名/発表者名
      Tomohiro I, Dominik Koeppl
    • 学会等名
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • 国際学会
  • [学会発表] Computing Longest (Common) Lyndon Subsequences2022

    • 著者名/発表者名
      Hideo Bannai, Tomohiro I, Tomasz Kociumaka, Dominik Koeppl, Simon J. Puglisi
    • 学会等名
      33rd International Workshop on Combinatorial Algorithms (IWOCA) 2022
    • 国際学会

URL: 

公開日: 2023-12-25  

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi