矢量量化
用码书中与输入矢量最匹配的码字的索引代替输入矢量进行传输与存储,而解码时仅需要简单地查表操作
矢量量化( Vector Quantization,VQ) 是 20 世纪70 年代后期新发展起来的一种有效的有损压缩技术,其理论基础是香农的速率失真理论。矢量量化的基本原理是用码书中与输入矢量最匹配的码字的索引代替输入矢量进行传输与存储,而解码时仅需要简单地查表操作。其突出优点是压缩比大、解码简单且能够很好地保留信号的细节。矢量量化在图像压缩领域中的应用非常广阔,如卫星遥感照片的压缩与实时传输、数字电视与DVD 的视频压缩、医学图像的压缩与存储以及图像识别等。因此矢量量化已经 成为图像压缩编码的重要技术之一。
基本概念
矢量量化是七十年代发展起来的一种数据压缩技术, 其理论基础是信息论中的“速率—失真理论”。对一定的码率R, 最小量化失真D (用量化信号与原始信号之间的误差均方值和原信号均方值之比来衡量) 是一定的,即D可表示为R的函数D (R) 。无论对于何种信源, 矢量量化总优于标量量化, 且矢量维数越大, 优越性越高。由此可知, 对于一个特定的信息源, 若给定码率R, 那么任何量化器都不可能获得低于“速率—失真理论”给出的下限D (R) 的量化失真。矢量量化的研究目的, 在于针对特定的信息源和矢量维数, 找到一种最优的矢量量化器, 能够在R一定时给出最小的失真。
基本原理
矢量量化是标量量化的拓广和延伸。可以这样描述矢量量化的基本原理。设有N个K维矢量{X1, X2, …, XN}, 其中第i个矢量可记为Xi={xi1, xi2, …, xik}, i=1, 2…, N。把K维空间RK无遗漏的划分为J个互不相交的子空间R1, R2, …RJ, 即满足:R1∪R2∪…∪RJ=RK;Ri∩Rj=!, i≠j。这些子空间R1, R2, …RJ称为胞腔 (cell) 。在每一个子空间中找出一个代表矢量Yi={yi1, yi2, …, yik}, i=1, 2…, J。令矢量集Y=[Y1, Y2, …, YJ], Y叫作码书或码本, Yi叫码字 (code word) 或码矢 (code vector) , 码书Y中的矢量个数J叫作码书长度。矢量量化的过程就是对任意输入矢量X∈RK, 在Y中找到一个与X最接近的Yi代替X, Yi就是X的量化值。矢量量化的过程可以看成是从K维欧氏空间RK到其中一个有限子集Y的映射。这个映射可以记为:Q:RK→Y={Y1, Y2, …, YJ}。
特点
矢量量化是标量量化思想的一种自然推广。标量量化利用了数据间的线性依赖性和概率密度函数的形状来消除冗余度。香农的速率-失真理论表明,即使信源是无记忆的,利用矢量编码代替标量编码总能在理论上得到更好的性能。实际上,是两种各分量间存在4种相互关联的性质:线性依赖性、非线性依赖性、概率密度函数的形状以及矢量维度。为了去掉数据之间的这些冗余,作为标量量化的一种推广,矢量量化就能够更好地压缩数据。
关键技术
矢量量化的三大关键技术,即码书设计、码字搜索和码字索引分配。
码书设计
矢量量化设计的首要问题和核心问题是码书的设计。如果没有码书的设计, 那么整个矢量量化系统就无法实现。码书的质量直接影响到压缩效率和复原信号的质量。
1980年, Linde, Buzo和Gray提出了一种有效的矢量量化码书设计算法, 也就是在矢量量化技术的发展中具有里程碑意义的LBG算法。LBG算法是码书设计的一种经典算法, 其优点为物理概念清晰、算法理论严密及算法容易实现。但是, LBG算法并不完美, 它的主要缺点是:对初始码书的依赖性强, 易收敛于局部最优。学者们主要针对LBG算法易陷入局部最小失真和对初始码书的依赖性强这两个方面对其进行改进, 提出了多种改进算法。a.基于神经网络的码书设计, 如自组织特征映射算法 (SOFM),它的收敛特性受初始码书的影响较小, 对初始码书和训练矢量的要求较低, 且可以很方便的修改已有的码书。它的缺点是计算量大。b.遗传算法。针对LBG易陷入局部最优的问题进行的改进, 能得到全局最优解。
码字搜索
码字搜索是矢量量化的一项关键技术。码字搜索是指在码书已经存在的情况下, 对于给定的输入矢量, 在码书中搜索与输入矢量之间失真最小的码字。研究码字搜索算法的主要目的就是寻求快速有效的算法以减少计算复杂程度, 且尽量使算法易于硬件实现。
针对穷尽搜索算法的缺点, 许多文献提出了各种各样的快速算法, 这些码字搜索算法可以分为两大类:一类是基于特殊码书结构的快速算法, 这类算法依赖于码书结构而在编码时只搜索较小的子码书, 如分类矢量量化和基于树结构的矢量量化等, 第二类算法不依赖于码书, 这类算法通常采用一些码字排除准则以减少计算量。这些算法有:a.部分失真搜索算法 (Partial Distortion Search, PDS) 。部分失真搜索算法的思想是:在计算某个码字与输入矢量之间的失真测度的过程中始终判断累计的部分失真是否已经超过目前的最小失真, 一旦超出则终止该码字与输入矢量间的失真计算。部分失真搜索算法是一种简单有效的算法, 但是其效率是有限的。b.基于Hadamard变换的搜索算法。这类算法利用了变换域的特点, 一是在变换域内搜索最匹配码字和在空间域内搜索最匹配码字是等价的, 另一个是变换域具有能量集中的特点。利用变换域的特点和其他搜索算法相结合能够产生的较高效率的算法。
码字索引分配
在矢量量化编码和解码系统中,如果信道有噪声,则信道输入端的索引i经过信道传输可能输出索引j而不是索引i,从而在解码端引入额外失真。为了减少这种失真,可对码字索引进行重新分配。码字索引分配就是在N!种分配方案中寻求一种最佳方法使得由信道噪声引起的失真最小。然而当N!较大时,测试所有方案是不可能的。因此,研究码字索引分配算法的目的就是寻求有效的算法尽可能找到全局最优或接近全局最优的方案以减少由信道噪声引起的失真,并尽可能减少计算复杂度和搜索时间。
应用
矢量量化(VQ)作为一种有效的有损压缩技术,其突出优点是压缩比大以及解码算法简单,因此它已经成为图像压缩编码的重要技术之一。矢量量化压缩技术的应用领域非常广阔,如军事部门和气象部门的卫星(或航天飞机)遥感照片的压缩编码和实时传输、雷达图像和军用地图的存储与传输、数字电视和DVD的视频压缩、医学图像的压缩与存储、网络化测试数据的压缩和传输、语音编码、图像识别和语音识别等等。矢量量化技术的研究涉及多学科领域的理论和技术,无论从理论角度还是从应用角度来看,开展对矢量量化技术的研究,不但具有重要的学术意义,还有极为重要的国防意义和经济意义。
最新修订时间:2022-08-26 11:01
目录
概述
基本概念
基本原理
参考资料