欢迎来到天天文库
浏览记录
ID:49410859
大小:445.00 KB
页数:22页
时间:2020-02-06
《Ch8 相关与回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、直线相关与回归分析LinearCorrelationandRegression相关分析和回归分析是研究变量与变量间相互关系的重要方法。为此,SAS系统提供了强大的相关分析与回归分析手段。相关分析可用CORR过程来处理,而回归分析则可用REG过程来完成。当然,特殊的回归分析SAS提供了专用的过程。这里,仅仅讨论CORR过程和REG过程的常规用法。PROCCORR;VARvariables;一、直线相关分析SAS提供的相关分析过程是CORR过程,它位于BASE模块中,可以计算的相关系数有:
2、Pearson积差相关系数、Spearman等级相关系数、Kendall‘stau-b统计量、Hoeffding’s独立性分析统计量D。此外,还可以计算偏相关系数等。CORR过程只有第一条语句(下划线部份)是必需的,其它语句都是可选的。常用语句及格式:语句说明1、PROCCORR[options];这里的选项有20多项。我们现在只介绍最简单的两个选项:缺省值:即第一条语句只有两个单词加上分号,即Proccorr;这时,SAS系统计算Pearson积差相关系数(普通相关系数)和进行显著性检验,以及简单统计量。
3、Spearman:即Proccorrspearman;此时,SAS系统计算Spearman等级相关系数。2、VARvariables;指明要计算相关系数的变量。例7-1为了了解年龄与总胆固醇之间的关系,随机抽查了20高血脂病人治疗前的总胆固醇水平(mmol/L)与年龄,资料见下表。试问年龄与胆固醇之间是否存在相关关系?首先建立SAS数据集dataex71;inputagechol;cards;245.436010.27287.49……….519.72345.72377.12317.54;run;由于数据太长
4、,此处以省略号代之调用CORR过程PROCCORRdata=ex71;RUN;程序中只有两条语句,第一条语句调用CORR过程,并指明分析数据集;第二条词句就是程序结束语句RUN。程序中没有VAR语句,则SAS系统对数据集中所有数值型变量进行相关分析。分析结果TheCORRProcedure2Variables:agecholSimpleStatisticsVariableNMeanStdDevSumMinimumMaximumage2039.4500013.01204789.0000020.0000060.
5、00000chol208.205502.17555164.110004.7100011.73000PearsonCorrelationCoefficients,N=20Prob>
6、r
7、underH0:Rho=0agecholage1.000000.84993<.0001chol0.84993<.00011.00000第一行为相关系数第二行为假设检验P值CORR过程的默认输出结果主要包括各个变量的简单统计描述和一个相关系数矩阵。简单统计描述:包括变量名、例数、均数、标准差等,这些都是前面的统计过程经常出现
8、的。相关系数矩阵:在相关系数矩阵的上方指明了相关系数的类型,如本例是”PearsonCorrelationCoefficients”,接下来就是对相关系数矩阵的说明,矩阵中每一个格子有两个数据,上方的数据是对应变量的相关系数,其下方的数据是该相关系数的显著性检验。本例中,age与chol的相关系数r=0.84993,p<.0001,因此可以认为年龄与胆固醇之间存在着较强的正相关。等级相关系数PROCCORRSpearmandata=ex71;RUN;计算等级相关系数只需在调用CORR过程的语句中加入选项“S
9、pearman”即可。SpearmanCorrelationCoefficients,N=20Prob>
10、r
11、underH0:Rho=0agecholage1.000000.84456<.0001chol0.84456<.00011.00000本例计算的age与chol的等级相关系数rs=0.84456,p<.0001SAS提供的回归分析的过程中,REG过程是一个最常用的过程。它采用最小二乘法拟合线性回归模型,同时还提供多种“最优”回归子集的方法,是一个应用广泛的回归过程。我们这里只介绍一元回归的情形。
12、二、直线回归分析语句格式PROCREG[options];MODELdependent=regressors;PRINTstb;PLOT[Y*X][/options];此过程中,下划线的部份是必需的。语句说明1、PROCREG[options];最常用选项:data=数据集2、MODELdependent=regressors;指定因变量(dependent)和自变量(regressors),即指定回归方程模型,
此文档下载收益归作者所有