可决系数_测定系数 - 威林百科weilinceramic.com

可决系数

测定系数

可决系数，亦称测定系数、决定系数、可决指数。与复相关系数类似的，表示一个随机变量与多个随机变量关系的数字特征，用来反映回归模式说明因变量变化可靠程度的一个统计指标，一般用符号“R”表示，可定义为已被模式中全部自变量说明的自变量的变差对自变量总变差的比值。

总变异的分割

一个特定数值对于其平均值的偏离，称为离差，而一变量的各数值对于其平均值的偏离，称为变异。通常用离差平方和来描述变异程度。离差平方和又简称平方和(Sum of square)。在研究单变量的离中趋势描述时，我们已经接触了离差平方和的概念，样本标准差的定义公式中就直接使用了上述概念。平方和被相应的自由度去除，得到平均平方，简称为均方(Mean square)。样本标准差就是被自由度(n-1)所平均的x对于离差均方的算术平方根。下面我们将应用平方的概念去开发测度一个回归方程拟合协变关系效果的量数。

先结合图1分析一下在因变量y倚自变量x回归前提下y值的离差。y值对其平均数的离差可以看作是由两部分合成的，一是y的回归拟合值对平均数的离差()，另一是y值对于拟合值的离差()。前者呈线性变化，在时，=0，x取值越偏离，这一离差就越大，存在着这样的函数关系：

这一离差完全是由y倚x的回归关系决定的，因而称为已解释离差(Explained deviation)。后者呈随机变化，与y倚x的回归关系无关，因而称为未解释离差(Unexplained deviation)。总离差与已解释离差、未解释离差的关系写成公式是：。

总离差的平方和，简称总平方和，用SST表示，又称作总变差(Total variation)。已解释离差的平方和，简称回归平方和，用SSR表示，又称作已解释变差(Explained variation)。未解释离差的平方和，简称误差平方和，用SSE表示，又称作未解释变差(Unexplained variation)。可以证明，由总离差的分解公式能推出总变差的分解公式：，或：SST=SSR+SSE。将上式两边都除以，得：已解释变差/总变量 +未解释变差/总变差=1，即

这样我们就把在绝对数意义上对总变差的分割，改换成在相对数意义上对总变差的分割，这对于研究回归方程的拟合效果很有帮助。

样本可决系数

从公式(1)看到，若以总变差为基数，相对数表示的是回归关系已经解释的y值变异在其总变异中所占的比率，而相对数则表示回归关系不能解释的y值变异在总变异中所占的比率。前者正是我们要寻求的测度回归方程拟合y对x的协变关系效果的量数，称为可决系数(Coefficient of determination)。产生于样本数据的可决系数是样本可决系数，用r2表示。在总体回归分析中，相对于样本可决系数的是总体可决系数，用表示。因此，样本可决系数的定义公式是：