欢迎来到天天文库
浏览记录
ID:49412540
大小:211.50 KB
页数:30页
时间:2020-02-06
《统计分析系统--SAS简介4.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、统计分析系统SAS应用杨泽峰7、相关和回归分析概述在科学研究和生产实践中,经常需要进行两类变量之间关系的分析。例如作物产量和种植密度、害虫的发生量和气象因子、动物的体重和生长天数等,这些变量之间的关系分析即相关和回归分析。相关和回归分析是生物学研究中最为常用的统计分析方法之一。7.1概述相关分析计算反映各个变量之间相关密切程度和性质的统计数。回归关系一般用反映依变量和自变量之间数量关系的回归方程表示,求解方法通常采用最小二乘法。回归分析依自变量个数的多少分为一元回归和多元回归;依依变量和自变量之间关系的性质分为线性回归
2、和非线性回归。线性相关和回归分析的SAS过程主要有相关分析(CORR)、回归分析(REG)和广义线性模型(GLM)。7.2常用过程的实现方法1、CORR过程过程格式Proccorr选项;Var变量表;With变量表;Partial变量;1、CORR过程语句说明除了PROC语句为必需,其他语句都是可选的,如果省略所有的可选语句,则对所有变量作相关分析。Proccorr语句选项设定相关系数,例如Pearson,Spearman等,缺省为Pearson相关系数。Var语句指明分析的变量。1、CORR过程语句说明With语句设
3、定放在左边的变量此时var语句的变量间和with语句的变量间的相关系数不给出,只输出两组变量间的相关系数。With语句缺省时,将计算var语句的变量之间的两两相关系数。Partial语句指明偏相关变量。设定partial变量时进行偏相关分析。相关分析结果输出包括简单统计数和相关系数及显著性。Corr过程--两个变量之间相关分析的实例2、REG过程过程格式Procreg选项;Model依变量=自变量/选项;Weight变量;Print选项;Ploty轴变量*x轴变量;2、REG过程语句选项Procreg语句Data=输入
4、数据集Outsscp=输出数据集,存储平方-乘积和矩阵Outest=输出数据集,存储参数估计值等。Simple给出简单统计数Corr给出简单相关系数2、REG过程语句选项Model语句设定线性数学模型等,Selection=模型选择方法包括none(全模型)、stepwise(逐步回归)、forward(逐个选入)、backward(逐个剔除)等。Weight语句指定加权系数变量Plot语句制作散点图3、GLM过程过程格式Procglm选项;Model依变量=自变量/选项;Run;3、GLM过程语句说明Procglm语
5、句设定分析所用的数据集和数据显示方式。Model语句定义模型和需要输出的统计数回归分析模型一般有以下形式Modely=x;一元线性回归模型。Modely=x1x2x3;三元线性回归模型。Modely=x1x2x1*x2x1*x1x2*x2;二元多项式回归模型。应用举例7.3多元线性回归REG过程不仅可以完成只有一个自变量的简单直线回归,还可以作含有多个自变量的多元线性回归。作多元线性回归时REG过程的语法格式与简单直线回归的语法几乎完全相同,只要把要分析的多个自变量名放在MODEL语句中应变量后即可。因为多元线性回归时
6、一般要作自变量的筛选,涉及到MODEL语句的选项。7.3多元线性回归语法选项SELECTION=method,规定变量筛选的方法,method可以是以下几种选项FORWARD(或F),前进法,按照SLE规定的P值从无到有依次选一个变量进入模型;BACKWARD(或B),后退法,按照SLS规定的P值从含有全部变量的模型开始,依次剔除一个变量;STEPWISE(或S),逐步法,按照SLE的标准依次选入变量,同时对模型中现有的变量按SLS的标准剔除不显著的变量;NONE,即不选择任何选项,不作任何变量筛选,此时使用的是含有全
7、部自变量的全回归模型。7.3多元线性回归语法选项SELECTION=method,规定变量筛选的方法,method可以是以下几种选项SLE=概率值,入选标准,规定变量入选模型的显著性水平,前进法的默认是0.5,逐步法是0.15SLS=概率值,剔除标准,指定变量保留在模型的显著水平,后退法默认为0.10,逐步法是0.15标准化偏回归系数STB可用来比较各个自变量作用的大小应用实例7.4非线性回归分析7.4非线性回归分析对于呈非线性关系的数据,有时通过适当的变量转换,即可化为线性回归方程利用REG过程求解。在SAS系统中,
8、更为一般的方法是利用非线性回归过程(NLIN)直接进行非线性最小二乘拟合。7.4.1NLIN过程过程格式Procnlin选项;Model依变量=模型表达式;Parms参数=初值;Der.参数=偏导表达式;Run;7.4.1NLIN过程语句说明Procnlin语句选项Data=分析数据集Method=循环迭代方法包括GAUSS(高斯
此文档下载收益归作者所有