研究概要 |
本課題では,形式言語理論および十分統計量を用いて無歪みデータ圧縮のユニバーサル性を簡潔に理解し,新しい方法論に基づいた高性能な圧縮アルゴリズムを提案することを目指して研究を行なっている. 今年度は十分統計量や最尤推定量を用いて,現在広く用いられている圧縮アルゴリズムである,a)「文脈モデルを用いた算術符号化」と,b)「Lempel-Ziv符号などブロック分割に基づく圧縮アルゴリズム」のユニバーサル性を統一的に理解することを目指して研究に取り組み,以下の実績を挙げることができた. (1)タイプ(経験頻度分布)を用いた圧縮アルゴリズムであるLynch-Davisson符号に対し,タイプの定常無記憶情報源に対する十分統計量としての性質に基づいて理論的な冗長度の解析を行なった.次に,タイプの最尤推定量としての性質を用いて,今回の解析方法が,タイプの組み合わせ的・確率的な性質を用いた従来の解析方法と同値であることを証明した.これにより,十分統計量や最尤推定量という統計学的なデータの性質がデータ圧縮とどのように関わっているかを明らかにすることができた. (2)Lynch-Davisson符号で用いるタイプを,条件付きタイプおよびブロックタイプを用いるように拡張した2種類のアルゴリズムを提案し,記憶のある情報源クラスに対するユニバーサル性を証明した.これまで行なわれてきた上記a)とb)の圧縮アルゴリズムの理論的な性能解析においては,別々の証明方法が用いられてきたが,今年度の研究によって,これらのユニバーサル性が同一の原理に基づくことが明らかになった.
|