• Search Research Projects
  • Search Researchers
  • How to Use
  1. Back to previous page

高度反復データに対する圧縮性指標の研究と圧縮情報処理への応用

Research Project

Project/Area Number 22K11907
Research Category

Grant-in-Aid for Scientific Research (C)

Allocation TypeMulti-year Fund
Section一般
Review Section Basic Section 60010:Theory of informatics-related
Research InstitutionKyushu Institute of Technology

Principal Investigator

井 智弘  九州工業大学, 大学院情報工学研究院, 准教授 (20773360)

Project Period (FY) 2022-04-01 – 2025-03-31
Project Status Granted (Fiscal Year 2023)
Budget Amount *help
¥4,160,000 (Direct Cost: ¥3,200,000、Indirect Cost: ¥960,000)
Fiscal Year 2024: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2023: ¥1,300,000 (Direct Cost: ¥1,000,000、Indirect Cost: ¥300,000)
Fiscal Year 2022: ¥1,560,000 (Direct Cost: ¥1,200,000、Indirect Cost: ¥360,000)
Keywordsデータ圧縮 / 圧縮性指標 / 圧縮データ処理 / 圧縮情報処理
Outline of Research at the Start

近年,爆発的に増加している繰り返しを多く含むデータ(高度反復データ)の圧縮可能性を適切に捉えるための圧縮性指標の研究を行う.まず,複数の圧縮性指標の間に成り立つ関係性を明らかにし,圧縮データ処理アルゴリズムへの応用について研究する.

Outline of Annual Research Achievements

近年,計算機性能やセンシング技術の向上,通信ネットワークの発達などを背景に,計算機上のデータが爆発的に増加している.これらのデータを有効に保存・活用するためには圧縮技術の利用が不可欠だが,一般に可逆圧縮の限界として知られるシャノンの情報量は,繰り返しを多く含むデータの圧縮可能性を適切に捉えられていない.例えば,同一種のDNA配列は個体間で数パーセントの差異しかないため,共通する部分配列を参照しあうことで大幅な圧縮が可能になるが,各塩基の頻度情報のみを利用するエントロピー符号ではほとんど圧縮することができない.近年,このような繰り返しを多く含む高度反復データを対象とした圧縮手法が盛んに研究されている.本研究では,高度反復データが有する圧縮可能性を適切に捉える圧縮性指標に関する研究および圧縮情報処理技術への応用に関する研究を行う.
2023年度は,数ある圧縮手法の中でRun-length Straight-line Program (RLSLP)とCollage Systemに着目して研究を行なった.本研究では,与えられた文字列に対して,最小RLSLPのサイズや最小Collage Systemのサイズを計算することがNP困難であることを証明した.この成果により,一般に大きな文字列データに対して最小RLSLPや最小Collage Systemを計算する効率的なアルゴリズムを望むことができないことが判明したが,小さな文字列データに対してでも現実的な時間で計算することができれば,これらの圧縮性指標をより深く理解するために助けになる.そこで,本研究では,最小RLSLPをMAX-SATソルバーを用いて計算する手法を提案した.これらの成果をまとめた論文はData Compression Conference (DCC) 2024に採択され発表を行った.

Current Status of Research Progress
Current Status of Research Progress

2: Research has progressed on the whole more than it was originally planned.

Reason

研究課題に対して成果が得られている.

Strategy for Future Research Activity

引き続き様々な圧縮性指標に関する諸問題に取り組む.

Report

(2 results)
  • 2023 Research-status Report
  • 2022 Research-status Report
  • Research Products

    (5 results)

All 2024 2022

All Journal Article (3 results) (of which Peer Reviewed: 3 results,  Open Access: 1 results) Presentation (2 results) (of which Int'l Joint Research: 2 results)

  • [Journal Article] On the Hardness of Smallest RLSLPs and Collage Systems2024

    • Author(s)
      Akiyoshi Kawamoto, Tomohiro I, Dominik Koeppl, Hideo Bannai
    • Journal Title

      Proc. Data Compression Conference (DCC) 2024

      Volume: - Pages: 243-252

    • Related Report
      2023 Research-status Report
    • Peer Reviewed
  • [Journal Article] Breaking a Barrier in Constructing Compact Indexes for Parameterized Pattern Matching2024

    • Author(s)
      Kento Iseri, Tomohiro I, Diptarama Hendrian, Dominik Koeppl, Ryo Yoshinaka, Ayumi Shinohara
    • Journal Title

      Proc. 51st International Colloquium on Automata, Languages, and Programming (ICALP) 2024

      Volume: -

    • Related Report
      2023 Research-status Report
    • Peer Reviewed / Open Access
  • [Journal Article] Substring Complexities on Run-length Compressed Strings2022

    • Author(s)
      Akiyoshi Kawamoto,Tomohiro I
    • Journal Title

      Proc. 29th International Symposium on String Processing and Information Retrieval (SPIRE) 2022

      Volume: - Pages: 132-143

    • DOI

      10.1007/978-3-031-20643-6_10

    • ISBN
      9783031206429, 9783031206436
    • Related Report
      2022 Research-status Report
    • Peer Reviewed
  • [Presentation] On the Hardness of Smallest RLSLPs and Collage Systems2024

    • Author(s)
      Akiyoshi Kawamoto, Tomohiro I, Dominik Koeppl, Hideo Bannai
    • Organizer
      Data Compression Conference (DCC) 2024
    • Related Report
      2023 Research-status Report
    • Int'l Joint Research
  • [Presentation] Substring Complexities on Run-length Compressed Strings2022

    • Author(s)
      Akiyoshi Kawamoto,Tomohiro I
    • Organizer
      29th International Symposium on String Processing and Information Retrieval (SPIRE) 2022
    • Related Report
      2022 Research-status Report
    • Int'l Joint Research

URL: 

Published: 2022-04-19   Modified: 2024-12-25  

Information User Guide FAQ News Terms of Use Attribution of KAKENHI

Powered by NII kakenhi