研究実績の概要 |
巨大文字列データを解析・利用するために,文字列を圧縮したまま様々な処理を効率的に行う「圧縮文字列処理」の研究を行った.主な成果として以下の五つをあげる.(1) 理論的に最良な領域で文法圧縮を行うアルゴリズムの提案.(2) 圧縮したまま最長共通接頭辞クエリに効率的に応えるためのデータ構造の提案.(3) 連長圧縮された Burrows-Wheeler 変換(RLBWT)をオンラインかつ圧縮領域で高速に構築する手法の提案.(4) RLBWT から Lempel-Ziv 77 (LZ77) の変換をオンラインで行う手法の提案.(5) 高い圧縮率を達成することで知られる文法圧縮 RePair を圧縮領域で計算する手法の提案.これらの成果をまとめた論文は,それぞれ国際会議の査読付き学会誌,Annual European Symposium on Algorithms (ESA) 2017, Combinatorial Pattern Matching (CPM) 2017, International Workshop on Combinatorial Algorithms (IWOCA) 2017, CPM 2018, Data Compression Conference (DCC) 2019 に受理され発表を行っている.(1) では,省スペースで動作することで知られていた従来手法の作業領域をさらに理論的限界まで絞ることに成功した.(2) の成果は recompression の技術を応用して得られたものであり,本研究のテーマである圧縮変換の理論の成果の一つである.(4) は RLBWT から LZ77 への圧縮変換によって LZ77 圧縮の効率化を達成するものである.(5) では任意の文法圧縮を RePair の文法に圧縮領域で変換する手法を提案した.
|