协方差分析亦称“共变量(数)分析”。方差分析的引申和扩大。基本原理是将线性回归与方差分析结合起来,调整各组平均数和 F 检验的实验误差项,检验两个或多个调整平均数有无显著差异,以便控制在实验中影响实验效应(因变量)而无法人为控制的协变量(与因变量有密切回归关系的变量)在方差分析中的影响。例如,在研究某种教学方法(实验变量)对学业成绩(实验效应)的影响时,被试的原有知识基础同时影响学业成绩,但往往在实验中难以选取具备相同知识基础的被试参加实验,可用协方差分析从学业成绩的总变异中将归因于被试知识基础差异的部分划分出去,便于确切地分析教学方法对学业成绩的影响,其中被试的知识基础就是协变量。
参数向量α 有一定的约束条件: 是模型的回归部分,设计矩阵 中变量是连续型的。因为含有两种类型因素(连续型,属性型)的混合,故称之为
协方差分析模型。但是这两部分不能同等对待,主要的还是方差分析部分,而回归部分只是因某些变量完全人为地控制而不得已引入的。
当研究者知道有些
协变量会影响
因变量,却不能够控制和不感兴趣时(当研究学习时间对学习绩效的影响,学生原来的学习基础、智力学习兴趣就是协变量),可以在实验处理前予以观测,然后在统计时运用协方差分析来处理。
对于仅涉及单个变量的试验资料,由于其总变异仅为“自身变异”(如单因素
完全随机设计试验资料,“自身变异”是指由处理和
随机误差所引起的变异),因而可以用
方差分析法进行分析;
对于涉及两个变量的试验资料,由于每个变量的总变异既包含了“自身变异”又包含了“协同变异”(是指由另一个变量所引起的变异),须采用协方差分析法来进行分析,才能得到正确结论。
如果那些不能很好地进行试验控制的因素是可量测的,且又和试验结果之间存在直线回归关系,就可利用这种直线回归关系将各处理的
观测值都矫正到初始条件相同时的结果,使得处理间的比较能在相同基础上进行,而得出正确结论。这一做法在统计上称为统计控制。
这时所进行的协方差分析是将回归分析和方差分析结合起来的一种统计分析方法,这种协方差分析称为
回归模型的协方差分析。
方差分析中根据均方MS与期望均方EMS间的关系,可获得不同变异来源的方差分量
估计值;在协方差分析中,根据均积MP与期望均积EMP间的关系,可获得不同变异来源的协方差分量估计值。