本課題では、形式言語理論および十分統計量、最尤推定量などの概念を用いて無歪みデータ圧縮のユニバーサル性を簡潔に理解し、新しい方法論に基づいた高性能な圧縮アルゴリズムを提案することを目指して研究を行っている。 今年は、十分統計量や最尤推定量を用いて、現在広く用いられている圧縮アルゴリズムである、a)「文脈モデルを用いた符号化」とb)「ブロック分割に基づく符号化」の2種類に対して、統一的なユニバーサル性の解釈を目指して研究を行ない、以下の結果を得ることができた。 (1)文脈モデルを用いた符号化とブロック分割に基づく符号化め両者に対して、条件つきタイプおよびブロックタイプの定常エルゴード情報源に対する漸近的な十分統計量としての性質を用いてユニバーサル性の証明を行うことができた。これにより、これまで別個に証明されてきたこれらの2種類の圧縮アルゴリズムのユニバーサル性を統一的に理解することが可能となった。 (2)昨年度までは、ユニバーサル性の定義として弱ユニバーサル性を用いて解析を行ってきたが、今年度の解析では強ユニバーサル性を用いて解析を行った。これにより、弱ユニバーサル性を定義として用いていた時に比べて、冗長度の精密な評価が可能となった。また、弱ユニバーサル性を定義として用いていた場合とは、漸近十分統計量とユニバーサル符号の関係が異なることが明らかになった。
|