研究概要 |
近年,無歪みデータ圧縮の新しい手法として,整列変換に基づくユニバーサル符号が注目されている.整列変換型のユニバーサル符号とは,圧縮対象であるデータ系列を整列に基づいて整数値の列に変換し,得られた整数列を適当なエントロピー符号化によって圧縮するものである.データ圧縮と予測とは表裏の関係にあり,入力の次の記号が予測できれば圧縮が可能となる.整列変換とは,次の入力記号の候補の集合に対し,予測に基づいた全順序関係を定義することにほかならない.本研究では,これを半順序に拡張した適応的アルファベット分解とよぶ概念を提案し,整列変換型ユニバーサル符号の具体例である文脈ソート法をこれに基づいて改良した.全順序集合は整数の符号化を使って圧縮することができるが,半順序集合の符号化には確率的なモデルの導入が必要になる.文脈ソート法を適応的アルファベット分解を使って再定式化し,それに確率モデルを組み合わせた結果,整列変換型ユニバーサル符号の代表例であるブロックソート法や確率モデル法としては実用上最も性能がよいとされるPPM法を上回る圧縮性能を得ることができた.特に,PPMモデルでは発見的に導入されていたエスケープ機能に対し,エスケープ確率をより合理的に導出するプロセスを示すことができた.このことは,従来理論的説明づけが十分になされていなかったPPMモデルでの種々の発見法に対する意味づけの糸口を与えるものである.今後は,適応的アルファベット分解の新たな応用の開拓に取り組む計画である.
|