逐步判别法
利用检验规则对变量进行逐步筛选同时进行判别的方法
逐步判别法是利用一些检验规则,对变量进行逐步筛选,同时进行判别的一种方法。
理论基础
逐步判别法的理论基础是附加信息检验。
设有 K 个母体G1 ,…,GK ,它们的分布是 N ,今从这K个母体分别抽了n1 ,…nk 个样品,为了对这K个母体建立判别函数,需要检验。
H0 :μ1 =…= μK
当H0 被接受时,说明区分这 K 个总体是无意义的,当假定被否定时,说明这K个母体可以区分,建立判别函数是有意义的。考虑为了区分这K个母体,原来选择的这 M 个指标是否可以减少而达到同样的判别效果,也就是说要去掉一些区分 K 个母体不带附加信息的变量。
基本思想
原则
在y1 ,y2 ,…ym 中先选出一个变量,它使维尔克斯统计量达到最小。不失一般性,假设挑选的变量次序是按自然的次序,即第 r 步正好选中yr ,第一步选中y1 ,则
Λ1 =min{Λi }
并考察Λ1 是否落入接受域,如不显著,则表明一个变量也选不中,不能用判别分析;如显著,则进入下一步。
在未选中的变量中,计算它们与已选中的变量y1 配合的Λ 值,选择使Λ1i 达到极小的作为第二个变量。
仿此,如已选入了 r 个变量,不防设y1 ,…yr ,则在为选中的变量中逐次选一个与它们配合,计算Λ {1,2,…,r,l} ,选择使上式达到极小的变量作为第 r+1 个变量,并检验新选的第 r+1 个变量能否提供附加信息,如不能则转入5,否则转入4
在已选入的 r 个变量中,要考虑较早选中的变量中其重要性有没有较大的变化,应及时把不能提供附加信息的变量剔除出去。剔除的原则同于引进的原则。例如在已进入的r个变量中要考察yl 是否需要剔除,就是计算Λ {l.1,…,l-1,,l+1,…}, r 选择达到极小的l,看是否显著,如不显著将该变量剔除,仍回到4,,继续考察余下的变量是否需要剔除,如显著则回到3。
这时既不能选进新变量,又不能剔除已选进的变量,将已选中的变量建立判别函数。
应用
绿茶香气是决定绿茶品质和风味的重要因子之一,历来受到研究者的重视。迄今为止,已分离鉴定的绿茶香气组分有300余种,并且随着样品前处理技术、定性和定量分析技术的迅猛发展,不断有新的绿茶香气成分被发现和鉴定,一方面,对绿茶香型的研究起到了极大的促进作用,另一方面,绿茶香气成分的众多,各芳香成分之间绝对含量、比例、阀值等因素的差异,构成了绿茶香型成因的多维性,也给绿茶香型的分析带来了一定的困难,特别是茶样香气信息远远超过了人的主观分析能力时。
对茶叶香型的识别主要采用感官审评的方法。但是,人的感官审评带有较大的主观因素,其审评结果存在相当大的个体差异,即使是同一个人,其嗅觉灵敏度也易受环境、工作程序、情绪、工作量等诸多因素的影响。为了使茶叶的感官审评更客观,使分析结果更可靠,有必要寻找一些方法将现代仪器分析技术、绿茶中芳香物质的信息、茶叶香型联系起来,为茶叶香型的判断提供一种更为全面、客观、可靠的方法,同时也为茶叶香型的计算机在线识别等其它香气分析技术在茶叶中的应用提供理论基础或参考。
研究拟用Bayes逐步判别法从香气成分、含量等信息上对绿茶的板栗香进行识别,并结合主成分分析对判别效果进行考察,为绿茶香型的理论研究和应用开发提供一定基础。
分析方法
用SAS9.0中stepdisc过程进行变量筛选,discrim过程对样品判别、验证,analysis模块进行主成分和多重比较分析。
筛选
根据各茶样感官审评的结果,将茶样分为两大类:板栗香(1,2,12,13,24,25#茶样)和非板栗香(3~11,14~23,26#茶样)。以1~18#茶样为训练样本,应用SAS软件Stepdisc过程从具板栗香茶样的26种共有香气成分中筛选出对区分板栗香与非板栗香有显著性影响的香气成分。模型引入和剔除变量的水平:0.15。从表2筛选结果,可知,依次有β-紫罗兰酮顺-茉莉酮和香叶基丙酮被引入,但香叶基丙酮被引入后,β-紫罗兰酮因其P值变为0.2604<0.15而被剔除。
研究结论
判别分析已广泛应用于变量的筛选、产品的分类分析、医学症状的诊断与分析等,在酒类、茶叶等食品的香气与香型上也有所涉及,但在茶叶各香型的比较研究中未见报道。
茶叶香型的呈现是由茶叶中各种芳香成分综合作用的结果,各香型茶样香气成分繁多,成分含量、比例等信息千差万别,形成了茶叶香型研究的复杂性。但并不是每个香气成分对香型的表现都有重要贡献,研究应用Bayes逐步判别法从庞杂的香气信息中筛选出板栗香与非板栗香的显著性差异成分——顺-茉莉酮和香叶基丙酮,判别分析、交叉验证和样本验证结果表明,Bayes逐步判别分析适用于绿茶香型的识别,并且识别效果理想。因此,通过Bayes逐步判别分析可以将茶叶的香型特征与其客观香气成分信息有机地联系起来,有利于从香气成分及其量上的差异揭示各种香型呈现的化学基础,并可将香型描述加以量化、识别。此外,通过本研究,可为香型的在线识别、香型特征性成分的寻找、香型的呈现、调配等技术提供有力的基础。
最新修订时间:2023-01-08 06:25
目录
概述
理论基础
基本思想
参考资料