相关指数R2表示
一元多项式回归方程拟合度的高低,或者说表示一元多项式回归方程估测的可靠程度的高低。
基础知识
事物之间的相互关系:
因果关系(两种事物)、共变关系(三种事物)、
相关关系(两种事物)。
相关:事物之间存在关系,但又不能直接做因果关系解释时,称事物间的联系为相关。
判断两个因素或变量之间是否有关系,定量地研究这些关系,称为
相关分析。
按性质不同,相关可以划分为:正相关、负相关、零相关。
正相关:两个变量向相同的方向变化。即一个变量的值增加,另一个变量得值也增加。
负相关:两个变量向相反的方向变化。即一个变量的值增加,另一个变量的值相应地减少。
零相关:两列变量之间没有关系,即一列变量变动时,另一列变量作无规律变动。
相关系数是一种描述性统计量,它指的是一个变量与另一个变量的变化的对应程度。符号:总体相关系数ρ;样本相关系数r。
直线回归:当一变量随另一变量有规律变化时,它们之间依存变化的数量关系称直线回归。
直线回归分析:据实测值建立一个回归方程,来定量表达两变量间数量依存变化关系的方法和过程。
决定系数表示的是两个变量之间共同方差的比例。用符号表示: 。例如:如果两个变量之间的相关系数r=0.82,那么 =0.67,我们就可以得出结论说,由于两个变量间的线性关系,Y变量的67%的变异可以有X变量中的变异来预测和解释。
拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数) 。可决系数的取值范围:[0,1], 越接近1,说明实际观测点离样本线越近,拟合优度越高。
相关系数和相关指数是两个不同的概念,一般是先求相关系数,分析相关性的强弱。然后求回归方程,最后求出相关指数,分析模型的拟合效果。
计算公式
总体平方和(Total Sum of Squares): 。
回归平方和(Explained Sum of Squares): 。
残差平方和(Residual Sum of Squares ): 。
三者关系:TSS=ESS+RSS。
Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此定义拟合优度:回归平方和ESS与Y的总离差TSS的比值。即 。
我们可以用 来刻画回归的效果。对于已经获取的样本数据,R2表达式中的 为确定的数。因此R2越大,意味着
残差平方和 越小,即模型的拟合效果越好;R2越小,
残差平方和越大,即模型的拟合效果越差。在线性回归模型中,R2表示解释变量对于预报变量变化的贡献率。R2越接近于1,表示回归的效果越好。
注意事项
问题
1.盲目的崇拜论文中展示或计算机计算出估计结果;
2.过度依赖方程总体拟合度在评价回归模型不同设定之间优劣时的作用;
3.判断系数的大小依赖于解释变量的个数,从而造成其在评价方程总体拟合度时出现偏误。
相应的处理方法
1.在承认回归结果以前,要从模型所隐含的理论到数据的质量,认真考察和评估所估计方程的每一个方面;
2.综合运用各种统计检验和计量检验;
3.尽量使用调整判断系数。
举例
例:一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 10 次试验,测得数据如下:
已知回归方程为:,求出相关指数 ,进行回归性分析。
解:计算得,,可以说明回归直线模型的拟合效果很好。