偏回归系数是
多元回归问题出现的一个特殊性质。设自变量x1,x2,…,xm与因变量y都具有线性关系,可建立回归方程:ŷ=b0+b1x1+b2x2+…+bmxm。式中b1,b2,…,bm为相应于各自变量的偏回归系数。表示当其他的各自变量都保持一定时,指定的某一自变量每变动一个单位,因变量y增加或减少的数值。
多元线性回归方程Y=a+b1X+b2X+…+bmXm中,各个自变量Xi的系数bi(i=1,2,…,m),称为因变量Y对自变量Xi的偏回归系数,相应的总体偏回归系数用βi表示。bi表示当其他自变量取值固定时,Xi变化(增加或减少)1个单位,则Y平均变化bi个单位,是反映Y随Xi数量变化的方向和大小(或快慢)的指标。bi>0,Y随Xi增加而增加;bi<0,Y随Xi增加而减少。|bi|值越大,Y随Xi变化越大(或越快)。bi的标准误为:
MS剩即多元
线性回归方程的
方差分析表中的剩余均方,Cii为自变量离差矩阵[lij]m×m的逆矩阵[Cii]m×m的对角线上的元素。bi的
显著性检验用t检验:
偏回归系数(partial regression coefficient)是
多元回归问题出现的一个特殊性质,如何理解、辨认和求取偏回归系数正是本文要讨论的。为了简化问题,我们把对偏回归系数的讨论,限定为只有2个
解释变量的系统,即建立的
经济计量模型为Yi=β0+β1X1i+β2X2i+ui(1) ,
回归方程为^Yi=^β0+^β1X1i+^β2X2i(2),式中^βi(i=0,1,2)为偏回归系数。
为了回答这个命题,首先,必须进行因素影响分析,即X1,X2对Y的作用关系分析。具体讲,这种作用关系有四种:其一是X1本身变化对Y的净作用;其二是X2的变化引起X1的相应变化。
首先,在考虑
偏导数的时候,我们认为其他
解释变量保持不变,即当做常数来处理(类似于微积分中的偏导数),本例中把X2看做常数,则X1变化一个单位,会引起Yi变化β1个单位,β1就为偏回归系数
偏回归系数的本质:就是自变量对因变量影响程度。但是,这种没有经过任何处理的回归系数因为有时自变量的变异程度和均数有时差别很大,直接用偏回归系数无法比较各个自变量影响程度。 所以,必须进行处理,即进行标准化,标准化后即可以直接比较。其实,还有许多系数,都是因为自变量量纲不同,需要进行标准化,例如
偏相关系数等。
标准化变量的多元
线性回归方程=b1′X1′+b2′X2′+…+bm′Xm′中,各个标准化自变量Xi′的系数bi′(i=1,2,…,m)。相应的总体标准化偏回归系数用βi′表示。标准化偏回归系数bi′消除了原偏回归系数bi的单位,表示当其他标准化自变量取值固定时,Xi′变化1个单位(即Xi变化1个标准差),则Y′平均变化bi′个单位(即Y平均变化bi′个标准差),是反映′随Xi′数量变化的方向和大小(或快慢)的指标。标准化偏回归系数的绝对值一般小于1。bi′和bi的关系为:
lii为Xi的
离均差平方和,lyy为Y的离均差平方和。bi′的标准误和bi的标准误的关系为:
标准化偏回归系数bi′用以比较各自变量Xi对应变量Y的作用大小,|bi′|值越大,Xi对Y的作用越大。但严格比较,要作两个标准化偏回归系数bi′和bj′的差别的
显著性检验,在差别有显著性的前提下才能比较。