肯德尔相关分析课件.ppt

肯德尔相关分析课件.ppt

ID:57031985

大小:2.70 MB

页数:58页

时间:2020-07-27

肯德尔相关分析课件.ppt_第1页
肯德尔相关分析课件.ppt_第2页
肯德尔相关分析课件.ppt_第3页
肯德尔相关分析课件.ppt_第4页
肯德尔相关分析课件.ppt_第5页
资源描述:

《肯德尔相关分析课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、SAS数据挖掘与分析——相关分析SAS数据挖掘与分析——肯氏相关分析相关分析--肯德尔等级相关系数Tb一、相关分析的概念相关分析(correlationanalysis)是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。当一个或若干个变量X取一定值时,与之对应的另一个变量Y的值虽然不确定,但却按某种规律在一定范围内变化,我们称变量之间的这种关系为不确定的统计关系或相关关系.例如,以X和Y分别记一个人的身高和体重,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程

2、度,这就是相关关系。相关分析1.1相关关系的概念相关分析◎按照相关关系涉及变量的多少:单相关和复相关◎按照相关关系的表现形式不同:线性相关和非线性相关◎按照相关现象变化的方向:正相关和负相关1.2相关关系的种类1.3相关关系的描述①相关表②相关图③相关系数2.1线性相关分析定义:研究两个变量间线性关系的程度。用相关系数r来描述。相关系数的取值范围在(-1,1)之间。二、相关分析的分类相关分析分为许多种,其中有线性相关分析、偏相关分析、距离分析。相关分析相关分析◎正相关:如果x,y变化的方向一致,如身高与体重的关系,r>0;一般地:

3、r

4、>0.95存在显著性相关;

5、

6、r

7、≥0.8高度相关;0.5≤

8、r

9、<0.8中度相关;0.3≤

10、r

11、<0.5低度相关;

12、r

13、<0.3关系极弱,认为不相关◎负相关:如果x,y变化的方向相反,如吸烟与肺功能的关系,r<0;◎无线性相关:r=0|r|越接近于1,说明相关性越好;|r|越接近于0,说明相关性越差。2.2相关系数的描述2.3相关系数的检验第一步:相关系数的显著性检验检验总体相关系数是否等于零;在总体相关系数p=0假设下,即是:原假设:(表示相关性显著)备择假设:(表示相关性不显著)0H:p=0H:p≠01相关分析--肯德尔等级相关系数τb第二步:决策判断:给定显著性水平p<,拒绝原

14、假设H0;p,接受原假设H0。相关分析主要包括有:◎Pearson相关:对定距连续变量的数据进行计算。◎Spearman和Kendall的等级相关:对分类变量的数据或变量值的分布明显非正态或分布不明时,计算时先对离散数据进行排序或对定距变量值排(求)秩。◎Hoeffding的D相关系数2.3SAS中线性相关三、Kendall等级相关系数τbKendall的等级相关系数τb,是利用等级来研究两个变量之间的两关程度。用于次序与次序比变量(其值具有等级高低、次序先后之分,如:教育水平)的相关测量。相关分析--肯德尔等级相关系数τbKendall相关系数Kendal

15、l相关系数采用非参数检验方法用来度量定序变量间的线性相关关系。Kendall统计量的数学定义为:n(n-1)2=(P-Q)相关分析--肯德尔等级相关系数τb其中,P为和谐对的个数,Q为不和谐对的个数。N为样本数量。和谐对是指变量大小顺序相同的两个样本观测值,即X的等级高低顺序与Y的等级顺序相同,否则称为不和谐对。相持:一对观察值OBS中,若有一个变量或两个变量的值对应相等,则该队观察值是相持的。相持还分为在x(记为Tx),或相持在变量上Y上(记为Ty).因此,肯氏相关系数的计算公式为:√(P+Q+Tx)(P+Q+Ty)(P-Q)τb=相关分析--肯德尔等级相关系

16、数τb肯氏公式还用到相持的概念:相关分析--肯德尔等级相关系数τb实例分析实例一例题:试用kendall等级相关分析智商高低与考试成绩是否存在肯氏相关。表:智商高低与考试成绩智商高低1208050901408740考试成绩938826981007653程序如下:dataabc;inputx1x2@@;datalines;1209380885026909814010087764053;proccorrkendall;varx1x2;run;quit;表示:ProcCORR语句的“kendall”选项要求CORR过程对数据进行肯氏相关分析。Part1:简单的描述统计

17、分析Part2:关于x1,x2肯德尔相关系数矩阵结果中先给出两变量的简单描述统计量,包括观测总数,各变量的均数以及标准差,中位数,最大值,最小值。然后给出两变量的相关系数矩阵。图二:x1,x2肯德尔相关系数矩阵样本相关系数R=0.71429概率值P=0.0243<0.05,则拒绝原相关系数是0的假设。假设相关系数R=0时的概率值P。注意:相关系数为0,表示x1与x2没有显著相关关系,但不表示变量之间无关。因他们可能存在某种不规则的变化。如图所示:prob>︱r︱概率值P=0.0243<0.05,则拒绝相关系数是0的假设,智商高低与考试成绩存在显著的相关关系。而且

18、样本相关系数R=0.71

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。