相关系数是最早由统计学家
卡尔·皮尔逊设计的统计指标,是研究变量之间
线性相关程度的量,一般用字母 r, ρx,y或Corr(X,Y) 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是
皮尔逊相关系数。
皮尔逊相关系数又叫相关系数或线性相关系数,是研究变量之间
线性相关程度的量,一般用字母r、ρx,y或Corr(X,Y)表示,用来度量两个变量间的线性关系。
其中,X, Y是两个随机变量,Cov(X,Y)为X与Y的
协方差,Var[X]为X的
方差,Var[Y]为Y的
方差。相关系数 r绝对值越大(越接近1),表明变量之间的线性相关程度越高;相关系数绝对值越小,表明变量之间的线性相关程度越低。相关系数为零时,表明变量之间不存在线性相关关系。故此,人们通常利用相关系数的大小来解释变量间相互关系的大小。