统计冗余
图像数据中经常存在的数据冗余
从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即:数据=信息+数据冗余。统计冗余是图像数据中经常存在的一种数据冗余。
定义
对于一串由许多数值构成的数据来说,如果其中某些值经常出现,而另外一些值很少出现,那么,这种由于取值上统计的不均匀性就构成了统计冗余。
处理技术
针对统计冗余,通常采用什么技术进行处理呢?最常用的是熵编码压缩技术。熵编码的主要思想是这样的:在一串由许多数值构成的数据中,对那些经常出现的值用短的码组来表示,对不经常出现的值用长的码组来表示,从而最终用于表示这一串数据的总的码位,相对于用固定长度码组来表示的码位而言得到了降低。目前用于图像压缩的具体的熵编码方法主要是霍夫曼编码,即一个数值的编码长度与此数值出现的概率尽可能地成反比。霍夫曼编码是熵编码理论里的最优编码,理论上是压缩比最高的无损压缩方式,在图像压缩编码中被广泛采用。(无损压缩是指用压缩后的数据进行重构即解压缩时,重构后的数据与原来的数据完全相同,从数学上讲是一种可逆运算。具体讲就是解码图像和压缩编码前的图像严格相同,没有失真。)
另外,对于视频图像中经常出现的一连串连续的像素点具有相同值的情况,典型的如彩条、彩场信号等,还有一种常用的处理办法:传输时,只传输起始像素点的值以及随后取相同值的像素点的个数。这种办法也可以有效地压缩码率,这就是行游程编码技术,它属于无损压缩。不过,在图像压缩编码中,行游程编码通常并不直接对图像数据进行编码,而是主要用于对量化后的DCT(Discrete Cosine Transform,离散余弦变换)系数进行编码。
参考资料
最新修订时间:2024-08-28 10:49
目录
概述
定义
处理技术
参考资料