相关系数
研究变量之间线性相关程度的量
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r, ρx,y或Corr(X,Y) 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数
定义
皮尔逊相关系数又叫相关系数或线性相关系数,是研究变量之间线性相关程度的量,一般用字母r、ρx,y或Corr(X,Y)表示,用来度量两个变量间的线性关系。
定义式
其中,X, Y是两个随机变量,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差。相关系数 r绝对值越大(越接近1),表明变量之间的线性相关程度越高;相关系数绝对值越小,表明变量之间的线性相关程度越低。相关系数为零时,表明变量之间不存在线性相关关系。故此,人们通常利用相关系数的大小来解释变量间相互关系的大小。
性质
取值范围
相关系数的取值范围为 [-1, 1] 。