2019 Fiscal Year Annual Research Report
An Analysis of the Theoretical Limit of the Compression Rate in Data Compression for Finite-Length Data
Project/Area Number |
15K15935
|
Research Institution | Tokyo Institute of Technology |
Principal Investigator |
松田 哲直 東京工業大学, 工学院, 助教 (00638984)
|
Project Period (FY) |
2015-04-01 – 2020-03-31
|
Keywords | データ圧縮 / 有限長 / 情報源符号化 / 情報理論 |
Outline of Annual Research Achievements |
データ圧縮の理論研究を行う情報理論では、データ長が無限大に漸近する場合における、漸近的な圧縮率の理論限界を解析することが多い。しかしながら、現実的にはデータ長が有限の場合の解析を行うことが重要である。本研究ではこの有限長解析において、圧縮率の理論限界に対する精度の高い上界と下界を閉じた式で与えることを目的とし、2019年度は以下の成果を挙げた。
1. 相関を有する複数の情報源から生起したデータをそれぞれ分散して独立に圧縮し、すべての圧縮データを同時に元のデータに戻すデータ圧縮を検討した。このデータ圧縮に対して、データの生起確率が未知の場合に達成できる圧縮率の理論限界の領域に対する内界と外界を与えた。また、データ長が無限大に漸近する場合には、得られた内界と外界が一致することを明らかにした。この成果はIEEEの論文誌に載録された。 2. 上記1の場合とは異なり、すべての圧縮データを参照して一つのデータのみを元に戻す場合のデータ圧縮について検討した。このデータ圧縮に対して、圧縮率の理論限界の領域に対する新たな内界の導出方法を開発した。また、データ長が無限大に漸近する場合には、得られた内界と圧縮率の理論限界の領域とが一致することを明らかにした。この成果はIEICEの英文論文誌に載録された。
研究期間全体を通じて、有歪みデータ圧縮の有限長解析を詳細に行い、圧縮率の理論限界に対する精度の高い上界と下界の閉じた式を与えた。さらに、情報源から生起したデータを分散して独立に圧縮する分散データ圧縮に対しても有限長解析を行い、様々な種類の分散データ圧縮について、圧縮率の理論限界の領域に対する内界と外界を与えた。
|