帧内预测
物理学术语
帧内预测是一个物理学术语,指的是H.264采用的一种新技术
在先前的H.26x系列和MPEG-x系列标准中,都是采用的帧间预测的方式。在H.264中,当编码Intra图像时可用帧内预测。对于每个4×4块(除了边缘块特别处置以外),每个像素都可用17个最接近的先前已编码的像素的不同加权和(有的权值可为0)来预测,即此像素所在块的左上角的17个像素。显然,这种帧内预测不是在时间上,而是在空间域上进行的预测编码算法,可以除去相邻块之间的空间冗余度,取得更为有效的压缩。
4×4方块中a、b、...、p为16 个待预测的像素点,而A、B、...、P是已编码的像素。如m点的值可以由(J+2K+L+2)/ 4 式来预测,也可以由(A+B+C+D+I+J+K+L)/ 8 式来预测,等等。按照所选取的预测参考的点不同,亮度共有9类不同的模式,但色度的帧内预测只有1类模式。
原理
在选择预测器时,主要是确定预测的阶数N,以及各个预测系数。
由图像的统计特性可知,一帧图像像素之间的相关系数在一定范围内可用指数型衰减曲线近似,像素距离小时,相关性较强,当像素距离增大时,相关性急剧减弱。因此,预测器的阶数不宜取得过大。实验表明,对于一般图像,取N = 4就足够了。当 N > 5时,预测效果的改善程度已不明显。
当阶数N一定后,通过求解N阶线性方程组(式1-2)就可以得到预测系数值{ai}。
例如,对于一幅图像像,如用X1,X2,X3,X4来预测X0,根据均方误差极小准则对整幅图像进行计算,得出4个预测值为:
由于前述的N阶线性方程组中Rij是与图像内容有关的量(协方差矩阵),造成对不同的图像就有一组不同的预测系数{ai},这在一个实际的编码器中是不能做到的。解决这一矛盾的方法是对一些标准图像作统计平均,并在实际应用场合,以恢复图像的主观效果作为系数的选择依据。
以下是几种常用的帧内预测方案(像素的位置见图1)。
① 1,0,0,0 (一维前值预测)
② 1/2,1/4,1/8,1/8 (二维预测)
③ 1/2,1/4,0,1/4 (二维预测)
这几种方案的特点都是实现方便,乘法运算只需用D触发器的抽头实现,运算量小,并且结合主观准则量化器的设计后,可以获得很好的压缩效果。
图1给出了预测方案③的一个具体编解码器框图。由于量化误差的作用,恢复值可能超出图像的8bit取值范围[ 0,255 ],因此用图中的限幅器进行限幅,把恢复值限定在256个电平范围内。
参考资料
最新修订时间:2024-12-23 15:52
目录
概述
参考资料