2013 Fiscal Year Annual Research Report
Project/Area Number |
23500006
|
Research Institution | Gunma University |
Principal Investigator |
横尾 英俊 群馬大学, 理工学研究科, 教授 (70134153)
|
Keywords | 情報基礎 / 情報理論 / データ圧縮 / 符号化 / ユニバーサル符号 |
Research Abstract |
無ひずみデータ圧縮のための記号列の可逆変換法の拡張と一般化を目指し,従来からあるBWTとよばれる変換法と新規なデータ圧縮法であるCSE法との関係を明らかにした。まず,2元BWT行列の左最小列数として定式化した最適化問題に対し,解の上限を線形時間で求めるアルゴリズムを構成した。このアルゴリズムに基づいて,CSE法の符号化と復号とを効率的に実現する手法を実装した。実際にプログラムとして実現して,実行時間および圧縮率を測定し,同時に,CSE符号化に組み合わせる種々の符号化モデルの実性能の比較を行った。その結果,漸近的な圧縮性能に関するこれまでの理論的予想を確認することができた。ただし,従来の冗長度評価では精度がまだ十分ではないこと,また,符号化モデルのわずかな違いは実際の圧縮性能には大きな影響を及ぼさないこと等も観察できた。これらの結果から,理論・実用の両面において,さらに詳細な検討を要する課題が鮮明になった。また,提案法ではLCP値とよばれる特徴量や最小一意部分列等の概念が本質的に重要であることから,本研究の成果はテキストアルゴリズムにおけるこれらの諸概念と確率モデルに基づくデータ圧縮法との関連性に新たな視点を導入していると考えることができる。辞書式データ圧縮法ではLCP値を利用した実現が近年の潮流であり,本研究で取り上げた変換型の圧縮法と辞書式法のような遂次型の手法,および確率に基づく手法とを統一的に記述する端緒を与えるものである。そのような視点に立って,次に取り組むべき今後の課題を最後にまとめた。
|