参数立体声,编码的基本思想就是传输一种描述立体声图像的数据,而这种数据是以混合单声道的边信息的形式传送的,这种立体声边信息非常简洁,虽然只占整个比特流很小的一部分,却可以使整个比特流的单声道信号获得最好的品质。
参数立体声编码(PS)技术是全境选频和立体声环境重建两种技术的结合,这种结合的技术使扬声器播放与耳机播放都能获得很好的立体声场景,解码时,立体声的合成重建空间特性,但并没有影响整个的谱能量,因此,与单一的核心信号相比,频谱上并没有什么变化。它的另一个优点就是向后兼容性,这样那些不支持参数立体声的解码器仍可以成功地解出单声道信号,这是因为PS数据存在比特流的扩充数据域内,这样可以很随意把它忽略掉,在AAC+SBR上应用参数立体声的设计目标范围是18~26 kbit/s,但这种技术可以在任何
比特率下应用。
在参数立体声工具中,有两种不同的立体声参数来描述立体声图像,即全境(Panorama)参数简称Pan和立体声环境(Stereo Ambience)参数简称SA,Pan参数包含左右信道不同选频标准的信息,而sA参数则包含立体声环境的选频信息,而这仅用左右信道的能量分布是不能够描述的。
当考虑到大多数立体声采用的中一边(mid—side)表示法时,与中信道相比,回响通常会过多地在边信道中被描述,这主要是因为大多数环境变量在合成单声道后会丢失,sA合成法就是一种将一个合成的版本加入到边信道中来重新生成丢失的环境变量的方法。
频域内的分析和综合可采用SBR系统里的QMF滤波器组,因为不需要额外的时一频转换,PS编解码只需非常小的开销,SBR系统中的QMF滤波器组是一个64信道复数滤波器组。
sA和Pan参数更新每一个SBR帧,并在帧之间进行线形内插以便得到平滑过渡,虽然sA和Pan被认为是两个独立的参数,但SA改良信号的效果会不同程度地受到Pan参数值的影响,在高的Pan值比如左右声道能量分布很不平衡时,SA的效果会显得不那么显著。
如图5所示,PS数据只在最终端才影响到信号,而且Ps编解码独立于现行的用于单声道的
编解码器。PS编码只产生少量的数据,这些数据是用来在解码时重建立体图像的,这些数据包括sA和Pan参数和一些控制
数据块。AAC+SBR利用MPEG一4音频
数据流结构,Ps数据存放在扩充数据域中,这样可以确保MPEG一4音频的向后兼容性,即使一些不支持Ps的解码器也可以把它当成附加数据而忽略。由于采用
熵编码,Ps的信号传输率是动态的,但对于立体声其
比特率的分布很少有(<1%)超过2 kbit/s的。Ps
数据流最终由编码器来选择,故很容易控制其不超过所要求的最大值,当以24 kbit/s的
比特率将Ps应用到AAC十SBR系统中去时,平均的比特率典型分布为:22.8 kbit/s核心数据(AAC+SSR)和1.2 kbit/s用于立体声的PS数据。
对于纯的单声道信号,Ps数据
比特率只有0.05kbit/s,故不会有单声道信号谱能显著软化的事情发生,当然,对于立体声宽度接近单声道的立体声信号,其Ps数据率会低于平均值。
正因为采用了包括PS技术在内的几种新的高压缩比技术,HE—AACV2技术可以在128 kb/s的
比特率下传送5.1多频段
音频信号,而在32 kb/s的比特率下可下载和传送近CD质量的音频信号,也可以以24 kb/s的比特率传送极高质量的立体声信号,甚至可以以良好的质量传送混合的低于16 kb/s的单声道音频信号。
PS编码技术是一种将立体声
音频信号视为单声道信号加上一小部分描述立体声影像信息的参数开销来有效编码的技术。立体声输入信号降混音成单声道信号,同时根据空间心理声学特性将立体声影像信息提取成少量高品质的立体声参数。单声道信号可以使用任何传统的音频编码器来编码,立体声参数经过量化编码后作为辅助部分嵌入到单声道比特流中。在解码器端,首先将比特流解复用成单声道信号流和空间立体声参数流,单声道信号解码后借助立体声参数来合成重建立体声信号。