研究概要 |
情報源の性質が未知であっても,一つの符号器で能率の良いデータ圧縮を実現できる符号化技術は,現在社会に展開しつつあるマルチメディア情報通信等の分野で必要とされており,とくに高速アルゴリズムと高圧縮性能をもつ符号器の開発が強く期待されている.本研究は,このような背景のもとで,高速で高能率の無歪み圧縮を目的として平成9,10両年度にわたり行われたものであり,次の3つの成果を得た. 1. 符号長の漸近特性について:本研究の符号化方式は,辞書の更新方法がLZMW符号と類似している.ただしLZMW符号がすべての辞書エントリがユニークであるのに対して,本符号化では同じ文字列が複数回登録される.したがって,本符号はLZMW符号の性能を上回るものではない.しかし,一方でアルゴリズムのもつ再帰性によりLZMW符号に比べて本符号の方が符号器/復号器の実装がはるかに容易であり高速である.2. アルゴリズムの符号化能率について:漸近的な特性が必ずしも優れていないにもかかわらず,符号化の早期の段階で長い系列が辞書に登録されるために,圧縮率の向上が急速である.したがって,有限長のデータ圧縮に対して有効な符号化アルゴリズムである.3. ポインタの符号化:辞書中のエントリの符号化には,通常良く使われる整数の符号化では不十分なことが分かった.そのためには生起確率に応じた符号長の付与をしなければならない.本方式では情報源アルファベットの大きさがデータ系列長の増大とともに増大するので,いわゆる「大きなアルファベットをもつ情報源のモデル化」の取扱が必要である.近接した文字列間の生起確率の違いが小さい,滑らかな確率分布をもつとした場合について,その推定アルゴリズムを明らかにした. 以上の研究成果は,今後無歪みデータ圧縮の基礎技術としての活用が期待される.
|