数值分类法(Numerical taxonomy)是
微生物鉴别方法—数值分类法。
介绍
数值分类法是根据数值分析,借助计算机将拟分类的微生物按其性状的相似程度归类的方法。
该法主要的分类原则是:①分类时视每个性状为同等重要,以避免分类者的主观偏见,使结果比较客观。②根据尽可能多的性状分类,以揭示分类单位间的真实关系。③按性状的相似度归为等同分类单元。
(2)数值分类法的基本程序
数值分类法的基本程序如下:
①分类对象与性状的选择:数值分类时,分类对象可能是菌株,也可能是种或属,所以称每个分类对象为一个操作分类单位。很多场合下,
OTU是指菌株。数值分类时,应根据工作目的认真地选择菌株,其中须包括与该分类单元有关的分类单元的模式菌株。如有可能,新近分离的菌株与世界不 同地区的菌株也应包括在内。
为达到更客观和精确区分的目的,选择的性状应尽可能多,通常不应少于50个,多者可达上百个甚至几百个。一般地说,所选性状数目越多,分类结果越可靠。所选性状应是尽可能广泛而又均匀地遍布于所研究的微生物中,形态的、生理生化的、生态的、免疫的、遗传的等性状都可以。但要注意,无意义性状和全同性状不宜选用,相关性状如运动性与鞭毛也不能同时选用。
②性状编码将观察和测得的性状用计算机所能识别和运算的符号记录下来。以分类中用得最多的两态性状,如对某种碳源利用与否,有无某种酶,能否在45°生长等为例,阳性结果(能利用某种碳源,有某种酶,能在45°生长等 )用“+”表示,阴性结果用“—”表示。如资料缺乏或可疑,可用“NC”表示。对于定量多态性状或定性多态性状采用加权递增编码法,将1个多态性状转化成多个3态性状。将性状编好码后,把它们排列成顺序号,形成一个性状(原始数据 )矩阵,然后输入计算机。输入计算机时分别用1和0表示,“NC”输入计算机时用“3”代表。
③相似度系数的计算:相似度系数是被比较的OTU对偶间整体相似程度的度量,它是根据每一对性状的相似程度计算出来的。计算相似度的方法很多,最简单的方法是计算对偶间相似性状的数目。
其计算公式如下: S=NS/(NS+ND)
上式中的NS表示比较的OTU对偶有相同性状的数目,ND表示被比较的OTU对偶有不同性状的数目。算出的相似度以百分数或比例表示。
④系统聚类(或等级聚类 ):根据相似度系数对OTU进行系统(或等级)聚类归群,得到相似度矩阵,即S矩 阵。如对10个菌株进行数值分类,经过系统聚类可得到S矩阵,相似度为百分数,100表示每个OTU自己与自己相比。
⑤聚类结果的表示:从
矩阵看不出这10个菌株间的相互关系,因此需要对矩阵进行重新处理,将相似度高的和低的分别列在一起,得到另一组矩阵。
然后再由此矩阵转换成能显示这10个菌株相互关系的树状谱。数值分类得到的是表观群。实践证明,表观群是等同于分类单元的。大约是75%相似度的表观群可视为同一种,比值达65%以上者可归入同一属。这样的结论和传统分类方法的结果通常是一致的。