研究実績の概要 |
巨大文字列データを解析・利用するために,文字列を圧縮したまま様々な処理を効率的に行う「圧縮文字列処理」の研究を行った.主な成果として以下の三つをあげる.(1) 圧縮したまま最長共通接頭辞クエリに効率的に応えるためのデータ構造の提案.(2) 連長圧縮された Burrows-Wheeler 変換(RLBWT)をオンラインかつ圧縮領域で高速に構築する手法の提案.(3) 理論的に最良な領域で文法圧縮を行うアルゴリズムの提案.これらの成果をまとめた論文は,それぞれ国際会議の査読付き学会誌,Combinatorial Pattern Matching (CPM), International Workshop on Combinatorial Algorithms (IWOCA), Annual European Symposium on Algorithms (ESA) に受理され発表を行っている.(1) の成果は recompression の技術を応用して得られたものであり,本研究のテーマである「圧縮変換」の理論の成果の一つである.RLBWT は圧縮領域で Lempel-Ziv 77 (LZ77) 圧縮形式に変換できることが知られており,(2) の成果によって圧縮領域で LZ77 圧縮を行うアルゴリズムの高速化が達成できた.さらに,現在,RLBWT から LZ77 の変換をオンラインで行う手法を開発することに成功しており,更なる高速化を達成している.(3) では,省スペースで動作することで知られていた従来手法の作業領域をさらに理論的限界まで絞ることに成功し,アルゴリズム一般の分野で最高峰の会議の一つである ESA に受理されるなど高い評価を得ている.
|