研究概要 |
算術符号を用いた無歪みユニバーサルデータ圧縮では,情報源の確率推定が重要であるが,多くの確率推定法の中でもっとも圧縮性能が高く,かつ実用的に洗練されているのが文脈木重み付け法(CTW法)である.本研究では,文脈木重み付け法およびそれを用いた算術符号を非定常情報源に適用することを目的とし,忘却機構のもとでそれを実現するアルゴリズム(FWCTW法)を様々提案し設計解析を行っている.昨年度は推定量にラプラス推定量を用いたアルゴリズムを提案し,シンボル確率がゼロになるという意味で構造を有する情報源に対して,有効であることを解析した.要点を述べると,基本的な評価モデルである定常マルコフ情報源に関して,冗長度は窓長(あるいは窓長無限モデルではデータ長)の対数に比例する.この定数は有効パラメータ数の半分であることが理想的であるが,既知の推定量では確率が存在しないシンボルもパラメータ数に含めてしまう.一方,本方法は,Krichevski-Trofimov推定量を持ちいる既知の方法からの簡単な修正でありながら,定数の増分を好きなだけ小さくでき,上記の欠点を実用上消し去ることができる.しかも,この事実はより基本的な定常情報源にも有効である点は重要である.さて,今年度の研究の方向も,構造を有する情報源について有効なFWCTWアルゴリズムに関するものである.上記の比例定数をさらに漸近的に無視できるときアルゴリズムはZero-冗長性を有するという.本年度は,Zero-冗長性を生む機構をFWCTWアルゴリズムに適用できることを提案し,その解析も行った.本結果は,アルファベットコストが大きく,実用性については問題があるが,昨年度の結果の理論的欠点を補う長所がある.この結果は,国際情報理論シンポジウムにおいても発表予定である.また,研究の総合年度として,CTW法の体系のなかで,有限窓CTW法を位置付け「情報源符号化ワークショップ」で発表した.
|