本研究では情報源系列から切り出した可変長のブロック集合を固定長の符号語集合に符号化するVF符号について,主に理論的観点から研究を行っている.今年度は,VF符号の圧縮限界について,最適なVF符号であるタンストールを対象として主に研究を進めた. 今年度は,長い系列から複数のブロックを切り出すマルチショット・タンストール符号について,符号語長の合計をブロック長の合計で割った個別符号化レートの期待値が情報源のエントロピーに収束することを示した.さらに,個別符号化レートが情報源のエントロピーに概収束することを示した.これらの解析の際に,複数のタンストール木のデカルト連結および複数のタンストール木の葉の数の幾何平均という2つの新しい概念を定義し,これらがマルチショット・タンストール符号の理論的な性能の解析の際に鍵となる性質であることを示した. また,この2種類の期待値の取り方に着目し,符号語長をブロック長の期待値で割った物を平均符号化レートとした場合にはタンストール符号が最適であるのに対し,個別符号化レートの期待値を平均符号化レートとした場合には,タンストール符号とは異なる符号が最適であることを示し,さらに,その符号を実現する逐次的なアルゴリズムを示した.これら2つの符号について理論的,実験的な比較を行った結果,提案した符号では,タンストール符号に比べて個別符号化レートの期待値だけでなく,最悪の符号化レートや符号化レートのオーバーフロー確率についても良い性能を示すことが明らかになった. 一方で,FV符号として最近提案されたが,まだ理論的な解析が進んでおらず,今後VF符号としての解析の可能性も考えられる,部分列数え上げ法(Compression by Substring Enumeration,CSE法)について,理論的な解析を行い,k次マルコフ情報源に対する最悪冗長度の評価を行った.
|