2016 Fiscal Year Research-status Report
オンライン型文法圧縮とVF符号化アルゴリズムによるストリーム型データ圧縮
Project/Area Number |
15K00002
|
Research Institution | Hokkaido University |
Principal Investigator |
喜田 拓也 北海道大学, 情報科学研究科, 准教授 (70343316)
|
Project Period (FY) |
2015-04-01 – 2018-03-31
|
Keywords | VF符号 / 文法圧縮 / 大規模データ / 透過的データ圧縮法 |
Outline of Annual Research Achievements |
本研究の目的は,可変長-固定長符号化(VF符号化)による効率よいデータ圧縮法を開発することである.ここで「効率よい」とは,次の三つの観点で優れていることを指す.第一に,データ圧縮としての基本性能である圧縮率・処理速度・メモリ消費量について,高いレベルでバランスしていること.第二に,ストリーム型データに対して,逐次的(オンライン)に符号化が行えること.そして第三に,圧縮後のデータ自体が,後の情報検索やデータ解析を補助する索引能力を持つことである.これらを兼ね備えたデータ圧縮法を確立することで,増加し続けるストリーム型データをコンパクトに格納しつつ,効果的に活用できる情報基盤システムを構築する.
昨年度は,Re-Pairアルゴリズムと同等のオンライン的な文法変換処理を実現する新規なアイデアを得たことで研究が大きく進展した.提案手法では,Re-PairアルゴリズムにLeft-Tall条件という制約を組み込むことで,通常では困難であったバッファリング処理による文法変換手続きを可能とした.また,この文法変換手続きを利用し,任意サイズの入力データに対して省メモリなデータ圧縮方式を実現することができた.実際,競合する圧縮法と比較して,データの圧縮率,圧縮処理速度等をほとんど犠牲にすることなく,メモリ使用量を大幅に低減することに成功した.
本年度は,これまで開発してきたRe-Pair-VF符号の統合化とプログラムの公開を行うとともに,文法圧縮とは異なる,高階関数を用いた新しい視点からの圧縮法に関する研究に着手した.
|
Current Status of Research Progress |
Current Status of Research Progress
1: Research has progressed more than it was originally planned.
Reason
本年度における目標はおおよそ消化したことに加え,最終年度の目標である研究計画の「A3.その他の文法圧縮の検討」について,文法圧縮を超える性能が期待できる新たな視点の圧縮法が見つかったため.
|
Strategy for Future Research Activity |
本年度では,研究計画の「B.ブロック分割と辞書の共有」についての研究開発を推し進めるとともに,これまで開発したプログラムの公開に努めた.今後は,研究計画の「C.大規模ストリーム型データへの実応用」について取り組み,実応用でのシステム構築を目指す.また,新たに高階関数を用いた圧縮法についての研究開発
|
Research Products
(1 results)