试验设计法,又称实验
设计法,是
数理统计学的一个分支,指研究如何制定实验方案,以提高实验效率,缩小随机误差的影响,并使实验结果能有效地进行统计分析的理论与方法。其基本思想是英国统计学家R.A.费希尔提出的。他在罗萨姆斯蒂德试验站任职时着重指出:在田间实验中,由于环境条件难于严格控制,实验数据必然受到偶然因素的影响,所以一开始就得承认存在误差。
背景介绍
这一思想与传统的“精密科学实验”相对立,在精密科学实验中,不是从承认误差不可避免出发的,而是致力于严格控制实验条件,以探求科学规律。田间试验的目的之一是寻求高产品种,而实验时的土地条件,如土质、
排水等都不能严格控制,因此,“在严格控制的这样或那样条件下,品种A比品种B多收获若干斤”这类结论的实际意义就不大。在现场进行的工业实验,医学上的药物疗效实验等,也有类似情形。这表明,费希尔创立的实验设计原则,是针对工农业以及技术科学实验而设,而不是着眼于纯理论性的科学实验。实验设计的基本思想,是减少偶然性因素的影响,使实验数据有一个合适的
数学模型,以便使用
方差分析的方法对数据进行分析。费希尔于1923年与W.A.梅克齐合作发表了第一个实验设计的实例,1926年提出了实验设计的基本思想,1935年出版了他的名著《实验设计法》。其中提出了实验设计应遵循的三个原则:随机化,局部控制和重复。随机化的目的是使实验结果尽量避免受到主客观系统性因素的影响而呈现偏倚性;局部控制是用划分区组的方法,使区组内部条件尽可能一致;重复是为了降低
随机误差的影响,以保证实验结果的重现性。费希尔最早提出的设计是随机区组法和
拉丁方方法,两者都体现了上述原则。
区组设计
指将u个处理安排在b个区组内作实验的一种实验设计法。所谓“处理”,是指诸如品种、工艺条件、
种植方法等因素或措施。例如,要比较三个品种的优劣,则每个品种是一个处理,共有三个处理;如试验中涉及三个品种和两种种植方法,则每个品种与每种种植方法搭配构成一个处理,一共有3×2=6个处理。每个区组能容纳的处理个数称为该区组的大小,常以k表示。若区组i的大小kj小于υ,则区组i容纳不了全部的处理,称这一类设计为不完全区组设计;当kj均不小于υ时,区组可以容纳全部处理,称这一类设计为完全区组设计。
设要比较8个不同的品种A,B,C,D,E,F,G,H,看哪一个品种产量比较高。若一个区组是一长条地块,将这个地块分成8个小块种植全部8个品种,就得一个完全区组。如共有4个这种区组,则8个品种在每个区组内的安排,要用
随机化的方法,将区组内的小块编置。图1就是一个具体的随机区组设计。如果有8个区组,每个区组可以容纳8个处理,那么不用随机化而用拉丁方进行设计,也能消除区组内各小块位置不同的影响。
拉丁方
指将 υ个拉丁字母(每个字母代表一个处理)排成υ行υ列的方阵,使得各个字母在各行各列出现一次且只一次。称υ为拉丁方的阶数。若把拉丁方的行看作区组,是一块田;把列也看作区组,则是施肥量;那么拉丁方设计不但能消除行内各小块位置不同的影响,还能可以消除列内施肥量不同的影响。
不完全区组设计
不完全区组设计在实际中常常遇到。一个区组可以是一块地、一辆汽车的四个轮胎或是车间的一个班组。当处理的数目太大时,要将全部处理安排在一个区组内是有困难的,因为区组的规模太大,就不能保证区组内的均匀性。由此,费希尔的合作者F.耶茨提出:将全部处理分成若干组,每组形成一个区组,使区组的大小缩小以保证区组内的均匀性。由于各个区组不包含全部处理,这种设计叫不完全区组设计。一般地,区组设计的狭义理解大都指不完全区组设计。
不完全区组分类
一类是
平衡不完全区组(BIB)设计,一类是部分平衡不完全区组(PBIB)设计。设(b)个区组大小相等,均为k,且k<υ,若能将υ个处理安排在(b)个区组内,使每个处理出现的次数r(称为重复数)都相同,且每两个不同处理恰好在λ个区组内相遇(称λ为相遇数),则称这种安排为一个BIB设计。若λ并不全一样,而是随着处理对的不同而分成若干类,则称这种情况为一个PBIB设计。某些其他设计可以看成是 BIB设计或PBIB设计的一些特殊类型。
在BIB设计的参数(υ,b),k,r和λ之间有如下的关系:。这些条件对 BIB设计的存在是必要的,但不是充分的。若(υ=b),从而k=r,则称为对称BIB设计。若υ为偶数,则r-λ必须是一个完全平方数,否则,设计不存在。例如由于r-λ=12-4=8不是完全平方数,不存在(υ=b)=34,k=r=12,λ=4的对称BIB设计,尽管这些参数满足上述必要条件。
析因设计
区组设计主要用于农业的单因素实验,而析因设计既能用于农业实验,又能用于工业和其他技术科学实验,其目的是了解因素对某项指标的影响。例如,某项产品质量受原料、加工温度、加工时间等因素的影响。若原料有三个产地:上海、天津和锦州,把产地作为一个因素,则它们是这个因素的3个水平。若可选的加工温度是80℃、90℃、100℃和105℃,加工时间是5分钟和7分钟,则加工温度和加工时间这两个因素分别有4个水平和2个水平。问题是要了解在这些因素的不同水平组合之下,产品质量是否有显著性差异,并进一步确定这样一种水平组合,使产品质量最好。析因设计就是将全部因素的水平组合起来做实验,使得既能估计各个因素的主效应,又能估计因素之间的交互作用。所谓主效应,是指同一因素各水平之间的差异;交互作用是指一个因素的效应因另一因素的水平的改变而起的变化。前例中有3个因素,它们分别有3、4、2个水平,把它们组合起来共有3×4×2=24个水平组合,称为3×4×2型实验。若这3个因素分别以A、B、C表示,则从这个实验可以算出3个主效应A、B、C;3个二因素交互作用A×B、A×C、B×C以及一个三因素交互作用A×B×C。 主效应和交互作用统称效应,三因素或更多因素的交互作用统称为高阶交互作用。
部分实施法
随着
因素个数和因素水平的增多,水平组合的数目急剧增加,例如,10个3水平因素的实验总共有310=59049个水平组合,将近6万个实验要全部进行是不可能的。1946年,英国统计学家D.J.芬尼在保证能估计全部主效应和少数一部分低阶交互作用的前提下,提出了部分实施法,即只挑选一部分水平组合做实验,忽略一部分低阶和全部高阶交互作用。正交表是进行部分实施法最方便的一种工具。
正交表
正交阵列的简称,是在拉丁方和
正交拉丁方的基础上形成的。它的形式和广泛应用同日本统计学家田口玄一的工作分不开,他的工作得到国际上的重视,在中国也有相当影响。表是正交表的一个例子,这个表记作 L8(27), 表示有8行7列,而每行都包含2个水平,它可用来安排 2水平的实验。按正交表安排并进行分析的实验称为正交实验。正交表有下述两个性质:一是任一列的每个水平出现的次数相同;二是任意两列的各种不同水平组合出现的次数相同。在实际应用中,当把因素对应于正交表各列时,各行则表示应做实验的水平组合。由于上述两个性质,任一因素的效应可不受其他因素干扰。
正交表的构作同组合数学有密切的关系,因此,有关正交表的一些理论性问题的探讨是纯粹数学的课题。