声音摄谱仪是一种动态
音频频谱分析仪,又称声谱仪(以下均简称声谱仪)。它主要由信号记录器、
频谱分析器和频谱输出器三个部分组成,能把声音信号记录下来而转变为可见图谱输出。
背景
利用人说话的声音对说话者进行鉴别是司法工作的古老话题,在西方已有数百年的历史。不过早些时候完全依赖于人的听觉分辨语音特征,具有很大的主观性和不确定性。随着研究手段和工具的改进,研究工作逐渐脱离了单纯的人耳听辨。具有里程碑意义的是1944年
美国贝尔实验室的L.G.Kesta博士发明的音响光谱图像显示器,它使人类通过机器自动识别人的声音成为可能。同时他还提出了“声纹(voiceprint)”的概念,导致了新的法庭技术——
声纹鉴定的出现。
音响光谱图像显示器是世界上最早的声音摄谱仪(语图仪 ) ,是进行声纹鉴定的重要仪器 。
简介
声音摄谱仪是一种动态
音频频谱分析仪,又称声谱仪(以下均简称声谱仪)。它主要由信号记录器、
频谱分析器和频谱输出器三个部分组成,能把声音信号记录下来而转变为可见图谱输出。我们可以通过图谱来观测声音信号的频率、幅度和时间等物理参量以及这三者之间的动态关系,从而了解被测信号的特征。
由于声谱仪显示的携带言语信息的声波图谱与指纹相似,也有“人各不一”的个体特征,所以称为
声纹。概括说来,声纹对同一个人具有较好的稳定性;声纹因人而异。
鉴别原理
研究揭示,发声的实质是人体语言中枢的命令引起声带振动,从而气流形成周期性的脉冲串并从喉向上经过口腔或鼻腔后从嘴或鼻孔向外辐射,其间的传输通道称为声道。声道是具有某种谐振特性的腔体,当气流通过时,输出的气流频率特性,即声门脉冲串的特性,取决于声带和声道的特性。嘴的作用是完成气流的向外辐射,嘴张开时的形状对语音差异有影响,但较声带和声道次之。根据这个差异就能认定被检验对象的声音。
表现格式
通用格式是具有两个几何尺寸的图形:横轴表示时间或rpm,垂直轴是频率; 指示特定时间的特定频率的幅度的第三维由图像中每个点的强度或颜色表示。
格式有许多变化:有时垂直和水平轴被切换,所以时间上下移动; 有时幅度表示为3D表面的高度而不是颜色或强度。 频率和幅度轴可以是线性的或对数的,这取决于图表的用途。 音频通常以对数振幅轴(可能以分贝或dB为单位)表示,频率将是线性的,以强调谐波关系,或对数强调音乐,音调关系。
应用
与其他生物识别技术诸如指纹识别、掌形识别、虹膜识别等相比较,声纹识别具有更为简便、准确、经济及可扩展性良好等众多优势,所以,除了应用在公安方面外,
声纹识别技术正广泛应用于诸多领域,在世界范围内,金融、证券、社保、军队及其他民用安全认证等行业和部门,都对声纹识别技术有着广泛的需求。比尔·盖茨就说过:“以人类生物特征(指纹、语音、脸像等)进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术。”
刑事侦查
利用声谱仪进行声纹鉴定技术,通过犯罪人(或当事人)与嫌疑人声纹的比较鉴别,确定两者是否为同一人的声纹的一种刑事科学和司法鉴定技术手段。声纹鉴定技术适用于刑事侦查和司法鉴定领域,能起到提供线索和审判证据的作用。
医学领域
声谱仪在医学临床领域有着重要的作用,以血流多普勒声谱仪为例,利用声谱仪通过计算多普勒信号的最大频率先自动提取声谱图的包络,对其进行分段、平均、归一等处理得到待分类决策的波形,与由临床资料建立的标准波形组进行比较,根据一定的判据将波形分类,最后与临床生理对照可以得出是否存在疾病的诊断。