pearson相关系数和spearman秩相关系数介绍

pearson相关系数和spearman秩相关系数介绍

ID:15401186

大小:391.50 KB

页数:6页

时间:2018-08-03

pearson相关系数和spearman秩相关系数介绍_第1页
pearson相关系数和spearman秩相关系数介绍_第2页
pearson相关系数和spearman秩相关系数介绍_第3页
pearson相关系数和spearman秩相关系数介绍_第4页
pearson相关系数和spearman秩相关系数介绍_第5页
资源描述:

《pearson相关系数和spearman秩相关系数介绍》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、皮尔逊积矩相关系数(Pearsonproduct-momentcorrelationcoefficient)1定义在统计学中,皮尔逊积矩相关系数(Pearsonproduct-momentcorrelationcoefficient),有时也简称为PMCC,通常用r或是ρ表示,是用来度量两个变量X和Y之间的相互关系(线性相关)的,取值范围在[-1,+1]之间。皮尔逊积矩相关系数在学术研究中被广泛应用来度量两个变量线性相关性的强弱,它是由KarlPearson在19世纪80年代从FrancisGalton介绍的想法基础发展起来的,

2、但是发展后原想法相似但略有不同的,这种相关系数常被称为“Pearson的r”。两个变量之间的皮尔逊积矩相关系数定义为这两个变量的协方差与二者标准差积的商,即上式定义了总体相关系数,一般用希腊字母ρ(rho)表示。若用样本计算的协方差和标准差代替总体的协方差和标准差,则为样本相关系数,一般用r表示:另外一个与上式等效的定义相关系数的公式是通过标准化以后变量均值的积定义的。假设样本可以记为,则样本Pearson相关系数为其中,和分别为标准化变量,样本均值和样本标准差。2皮尔逊积矩相关系数的数学特性不论是样本的还是总体的Pearson

3、相关系数绝对值均小于等于1,相关系数等于1或-1时,所有数据的点都精确地落在一条直线上(为样本相关系数的情况),或是两变量的分布完全由一条直线支撑(为总体相关系数的情况)。Pearson相关系数具有对称性,即:corr。Pearson相关系数的一个关键的特性就是它并不随着变量的位置或是大小的变化而变化。也就是说,我们可以把X变为a+bX,把Y变为c+dY,其中a,b,c和d都是常数,而并不会改变相互之间的相关系数(这点对总体和样本Pearson相关系数都成立)。Pearson相关系数可以用原点矩的形式表示。因为,,对于Y也有相似

4、的表达式。又于是式(1)可写为上述形式对于样本的Pearson相关系数同样是可用的,有上式提供了一个非常简单的计算样本相关系数的算法,但是有时受数据的影响,可上式可能存在数值上的不稳定性。相关系数取值范围为[-1,1]。取1时表示变量X和Y之间具有线性变化的关系,即Y随着X的增加而增加,而且所有的点都落在一条直线上。取-1时则是所有点落在一条直线上,但是变量Y随着X的增加而减小。相关系数值为0是表示变量之间没有线性相关关系。更一般地,应该注意到,只要和落在各自均值的同一侧,那么就是大于0的。也就是说,只要和同时趋近于大于或是同时

5、趋近于小于他们各自的均值,那么它们的相关系数为正。反之,当二者区于在相反的一边时,二者相关系数为负。几种的(x,y)点即相应的x、y的相关系数。可以看出,相关反映线性关系分散程度和方向(第一行),但是不能反映线性关系时的斜率(第二行),也不能反映出非线性关系的许多方面(最底下一行)。注:图中第二行第四个小图的直线斜率是0,在这种情况下,相关系数是没有意义的,因为Y的方差是零。3几何解释对于相对中心性的数据(例如,一组已经通过样本均值转换为均值为0的数据),相关系数可以看做是由两随机变量样本绘出的两个向量之间夹角的余弦值。有些学者

6、则比较倾向于非中心性(费皮尔逊兼容)的相关系数。以下通过一个例子比较二者之间的差异。假设有5个国家,国民生产总值分别为10亿美元、20亿美元、30亿美元、50亿美元和80亿美元,而贫困人数占总人口的比例分别为11%、12%、13%、15%和18%。则可令X=(10,20,30,50,80),Y=(0.11,0.12,0.13,0.15,0.18)。有一般的计算两个向量之间的角度的过程(点乘)可得非中心性相关系数为:应该注意到,上述数据是特意从完全线性相关的线性函数Y=0.10+0.001X中挑选出来的,所以Pearson相关系数

7、应该精确地为1。将数据中心化(将X减去E(X)=38,Y减去E(Y)=0.138),可得X’=(-28,-18,-0.8,12,42),Y’=(-0.028,-0.018,-0.08,0.012,0.042),并有跟期望的一样。相关系数大小与相关性大小的关系许多学者都提出了通过相关系数大小判断变量相关性的标准。但是正如Cohen(1988)所指出的一样,这些标准或多或少的有些武断,不应该过于严格地遵守。相同相关系数对相关性大小的判断取决于不同的背景和目的。同样是0.9的相关系数,在使用很精确的仪器验证物理定律的时候可能被认为是很

8、低的,但是社会科学中,在评定许多复杂因素的贡献时,却可能被认为是很高的相关性。相关系数与相关性的关系相关性负值正值不相关−0.09~0.00.0~0.09低相关−0.3~−0.10.1~0.3中等相关−0.5~−0.30.3~0.5显著相关−1.0~−0.50.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。