内部一致性信度,又称内部一致性系数,是指用来测量同一个概念的多个计量指标的一致性程度。
含义及计算
含义
内部一致性信度(internal consistency reliability),也叫做内部一致性系数(coefficient of internal consistancy)、
同质性信度(homogeneity reliability),它是指测验内部所有题目间的一致性程度。
这里的“一致性”指的是分数的一致,而非题目内容或形式的一致。因此,若测验的各个题目得分有较高的正相关时,不论题目内容和形式如何,测试都是同质的;相反,即使所有题目看起来都好像测量同一特质,但分数相关很低时,这个测验就是
异质的。
内部一致性信度主要反映的是测验内部题目之间的
信度关系,考察测验的各个题目是否测量了相同的内容或特质。
说明
复本法适用于许多测验,尤其是
能力测验(学业能力,智力,特殊能力)。但是,为测验建立复本通常花费较高,而且很难顺利编制。于是,研究者就把测验项目划分成不同的样本,从而间接地考虑一致性信度,这就是内部一致法(method of internal consistency)。
但是,内部一致性系数(internal consistency coefficients)并不能反映这些误差。因此,不能把内部一致性系数等同于真正的
重测信度或
复本信度。
计算
基本公式
测量同质性的基本公式如下:
其中K为构成测验项目数, 为项目间相关系数的平均数, 为同质性信度值。
库—理信度系数
库德(G. F. Kuder)和
理查逊(M. W. Richardson)提出了一系列公式来估计测验的信度,但只适用于答对一题得一分、答错无分的测验。
1)K-R20公式:
式中K表示构成测验的题目数,pi为通过第i题的人数比例,qi为未通过第i题的人数比例, 为测验总分的变异数。
2)K-R21公式:
式中K为构成测验的题目数, 为测验总分的平均数, 为测验总分的变异数。
克伦巴赫α系数
针对项目多重记分的测验,克伦巴赫(L. J. Cronbach)提出
α系数的方法,其公式为:
式中K为测验的题目数, 为某一题目的变异数, 为测验总分的变异数。
克伦巴赫α系数是学术界普遍使用内部一致性
系数(Cronbachα)检验量表的内部一致性信度。Hair,Anderson,Taehan,eta1.(1988)指出,内部一致性系数大于0.7表明量表的可靠性较高;在探索性研究中,内部一致性系数可以小于0.7,但应大于0.6;Peter(2002)指出,问项数量小于6个时,内部一致性系数大于0.6,表明量表是有效的。本研究利用各个
潜变量的Cronbachα系数处于0.793~0.931(见下表),都超过了0.7可接受水平,表明各个概念的量表都具有较高的可靠性。
各概念量表Cronbachα系数
荷伊特信度
1941年荷伊特(C. Hoyt)提出用分差分量比来衡量测验内部一致性的方法,公式如下:
rxx=1-MS人×题/MS人
式中MS人是同人与人间差别有关的均方差,MS人×题是同人与题目交互作用有关的均方差。
因素分析
有些测量学家认为
因素分析是决定测验同质性的最好方法,特别是当测验明显测量的是几个不同的特质时,其具体方法如下:
先建立每个被试在每个题目上得分的资料矩阵,再建立所有题目间的相关矩阵,然后对每一组有相关的题目命名一个因素。
一般研究人员只需掌握
因素分析法的基本原理,借助计算机进行演算,并能对计算机运算后输出的结果进行解释就可以了;无需耗费时间和精力在算数演练上。
综合信度ρo系数分析
另一种评价内部一致性信度的方式是利用各个
潜变量的综合信度ρo系数,具体可接受的标识综合信度ρo系数是0.7(Chin,1988;Barclay,Higgins,&Thompson,1995)。从下表可以看出,综合信度ρo系数为0.740~0.905,均超过了0.7可接受水平。
注:*表示该数值在计算过程被设定为1,因此没有T值。
从上述两方面的信度指标分析结果来看,所有概念的量表都满足最低要求,这充分说明本研究所使用的量表具有良好的内部一致性信度。
存在的问题
内部一致性估计是有用的信度
量数,因为它只测量一次,因此可以排除记忆和练习的效果。然而,也存在一定的问题:
1)它们只可在测量单一特质的测验上使用。
e.g.它们可用于拼音测验,但不能用在包含拼音、阅读理解和作文等部分的语文测验。
2)当应用在速度测验上时,内部一致性量数会有信度估计膨胀的现象。
因为速度测验都是简单或相对简单的题目,并且要在限制时间内完成。在这样的测验中,受测者应该可以答对他所作答的大多数题目,因此内部一致性都会很高。