模式识别系统基本上是由三部分组成,即数据采集、数据处理和分类决策或模型匹配。模式识别系统广泛应用在语音识别、指纹识别、数字水印等领域。
简介
一个完整的模式识别系统基本上是由三部分组成,即
数据采集、
数据处理和分类决策或
模型匹配。在设计模式识别系统时,需要注意模式类的定义、应用场合、模式表示、特征提取和选择、聚类分析、分类器的设计和学习、训练和测试样本的选取、性能评价等。针对不同的应用目的, 模式识别系统三部分的内容可以有很大的差异, 特别是在数据处理和模式分类这两部分,为了提高识别结果的可靠性往往需要加入
知识库(规则)以对可能产生的错误进行修正,或通过引入限制条件大大缩小识别模式在模型库中的搜索空间,以减少匹配计算量。
组成及工作原理
模式识别系统基本由数据采集、数据处理和分类决策或模式匹配组成,他们的工作原理如下:
数据采集
数据采集是利用用各种传感器把被研究对象的各种信息转换为计算机可以接受的数值或符号串集合。习惯上,称这种数值或符号串所组成的空间为模式空间。这一步的关键是传感器的选取。为了从这些数字或符号串中抽取出对识别有效的信息, 必须进行数据处理, 包括数字滤波和特征提取。
数据处理
数字滤波是为了消除输入数据或信息中的噪声,排除不相干的信号, 只留下与被研究对象的性质和采用的识别方法密切相关的特征如表征物体的形状、周长、面积等等。在进行指纹识别时,指纹扫描设备采用合适的滤波算法, 如基于块方图的方向滤波、二值滤波等,过滤掉指纹图像中不必要的部分。
特征提取是指从滤波数据中衍生出有用的信息, 从许多特征中寻找出最有效的特征,以降低后续处理过程的难度。我们对滤波后的这些特征进行必要的计算后,通过特征选招环口提取或基元选择形成模式的特征空间。那么,如何判断什么特征是最有效的呢?人类很容易获取的特征,对于机器来说就很难获取了,这就是模式识别中的特征选择与提取的问题。特征选择和提取是模式识别的一个关键问题。一般情况下,候选特征种类越多,得到的结果应该越好。但是,由此可能会引发维数灾害,即特征维数过高,计算机难以求解。因此, 数据处理阶段的关键是滤波算法和特征提取方法的选取。不同的应用场合,采用的滤波算法和特征提取方法以及提取出来的特征也会不同。
分类决策或模型匹配
基于数据处理生成的模式特征空间,人们就可以进行模式识别的最后一部分模式分类或模型匹配。该阶段最后输出的可能是对象所属的类型, 也可能是模型数据库中与对象最相似的模式编号。
模式分类或描述通常是基于已经得到分类或描述的模式集合而进行的。人们称这个模式集合为训练集,由此产生的学习策略称为监督学习。学习也可以是非监督性学习,在此意义下产生的系统不需要提供模式类的先验知识,而是基于模式的统计规律或模式的相似性学习判断模式的类别。
模式分类或模式匹配的方法很多,主要是基于以下思想设计的成员表,即模板匹配。基于该思想,分类系统中会预先存储属于同一模式类的模式集,然后将输入的未知模式与系统中已有的模式相比较,具有相同或相似匹配的模式类即为该未知模式的所属类型。一般特征:这里模式的一般特征被存储在一个分类系统中,当有一个未知模式进入该系统时,系统会将其一般特征与系统中现有类的一般特征相比较,并将其归入到与其有相似特征的类中。聚类文中笔者用实数向量来表示目标类的模式,这样,利用其聚类特性,可以轻易地将未知模式进行分类。如果目标向量在几何位置上相距很远,就容易确定未知模式的类别。但是如果目标向量相距较近, 或甚至有重叠, 人们就需要采用比较复杂的算法来确定未知模式的类别。最小距离分类法就是一个基于聚类概念的重算法。该算法通过计算未知模式与希望的已知模式集之间的距离,来决定哪一个已知模式与该未知模式最近,并最终将该未知模式归入到与其相距最短的已知模式类中。该算法对于目标向量在几何位置上相距很远的模式分类很有效。
神经元:上面的模式分类思想都是基于机器的直接计算,而直接计算则是基于数学相关的技术。仿生学是指将生物学知识应用到电子机器中。神经系统方法就是将生物知识应用于机器中来进行模式识别, 从而引进了人工神经元网络。一个神经元网络是一个信息处理系统,由大量简单的数据处理单元组成,这些单元互相连接,协同工作,从而实现大规模并行分布处理。神经元网络具有自适应学习、自组织和容错力等优点由于这些突出特点,人们可以应用神经元网络进行模式识别。一些最好的神经元网络模型是后向传播网络、高阶网络、时延和周期性网络。通常,人们利用前向传播网络进行模式识别。前向传播也就是没有回到输入端的反馈信息。与人类从错误中得到教相似,神经元网络也能通过向输入端反馈信息,从其错误中得到教训。通过反馈可以重建输入模式,避免产生错误,从而提高神经元网络的性能。当然,构造这样的神经元网非常复杂。这类神经元网络要用到后向传播算法(BP)。后向传播算法的主要问题之一是局部极小问题。另外,神经元网络在学习速度、结构选择、特征表示、模块性、缩放性等方面也都存在一些问题。虽然神经元网络存在这样这样那样的问题和困难,但是其发展潜力还是巨大的。
应用
语音识别技术
语音识别技术正逐步成为信息技术中人机接口的关键技术,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。中国互联网中心的市场预测,未来5年,中文语音技术领域将会有超过400亿人民币的市场容量,然后每年以超过的速度增长。
生物认证支术
生物认证技术是本世纪最受关注的安全认证技术,它的发展是大势所趋。人们愿意忘掉所有的密码、扔掉所有的磁卡,凭借自身的唯一性来杨只身份与保密。在银行里, 人们只需伸出手指放在识别仪上就可以存取现金将指日可待。
国际数据集团(IDC)预测作为未来的必然发展方向的
移动电子商务基础核心技术的生物识别技术在未来10年的时间里将达到美元的市场规模。
数字水印技术
90年代以来才在国际上开始发展起来的
数字水印技术是最具发展潜力与优势的数字媒体版权保护技术。旧预测,数字水印技术在未来的年内全球市场容量超过80亿美元