sas学习系列 一元线性回归.

sas学习系列 一元线性回归.

ID:12955701

大小:403.43 KB

页数:15页

时间:2018-07-19

sas学习系列 一元线性回归._第1页
sas学习系列 一元线性回归._第2页
sas学习系列 一元线性回归._第3页
sas学习系列 一元线性回归._第4页
sas学习系列 一元线性回归._第5页
资源描述:

《sas学习系列 一元线性回归.》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、22.一元线性回归回归分析是研究一个或多个变量(因变量)与另一些变量(自变量)之间关系的统计方法。主要思想是用最小二乘法原理拟合因变量与自变量间的最佳回归模型(得到确定的表达式关系)。其作用是对因变量做解释、控制、或预测。回归与拟合的区别:拟合侧重于调整曲线的参数,使得与数据相符;而回归重在研究两个变量或多个变量之间的关系。它可以用拟合的手法来研究两个变量的关系,以及出现的误差。回归分析的步骤:(1)获取自变量和因变量的观测值;(2)绘制散点图,并对异常数据做修正;(3)写出带未知参数的回归方程;(4)确定回归方程中参数值

2、;(5)假设检验,判断回归方程的拟合优度;(6)进行解释、控制、或预测。一、一元线性回归模型为Y=?0+?1X+ε其中X是自变量,Y是因变量,?0,?1是待求的未知参数,?0也称为截距;ε是随机误差项,也称为残差,通常要求ε满足:①ε的均值为0;②ε的方差为?2;③协方差COV(εi,εj)=0,当i≠j时。即对所有的i≠j,εi与εj互不相关。二、用最小二乘法原理,得到最佳拟合效果的值:,三、假设检验1.拟合优度检验总偏差平方和及其自由度:回归平方和及其自由度:残差平方和及其自由度:TSS=RSS+ESS通常可以认为当R

3、2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。2.回归方程参数的检验回归方程反应了因变量Y随自变量X变化而变化的规律,若?1=0,则Y不随X变化,此时回归方程无意义。所以,要做如下假设检验:H0:?1=0,H1:?1≠0;(1)F检验若?1=0为真,则回归平方和RSS与残差平方和ESS/(N-2)都是?2的无偏估计,因而采用F统计量:来检验原假设β=0是否为真。(2)T检验对H0:?1=0的T检验与F检验是等价的(t2=F)。对H0:?0=0的T检验,若?0=

4、0为真,t统计量为:3.用回归方程做预测得到回归方程后,预测X=x0处的Y值.的预测区间为:其中tα/2的自由度为N-2.SAS中是用model语句中的clm选项来计算预测区间的。4.回归诊断(1)残差图分析残差图就是以残差为纵坐标,某一个合适的自变量为横坐标的散点图。回归模型中总是假定误差项是独立的正态分布随机变量,且均值为零和方差相等为?2.如果模型适合于观察到的数据,那么残差作为误差的无偏估计,应基本反映误差的假设特征。即残差图应该在零点附近对称地密布,越远离零点的地方就疏散(在形象上似有正态趋势),则认为模型与数据

5、拟合得很好。若残差图呈现如图(a)所示的形式,则认为建立的回归模型正确,更进一步再诊断“学生化残差”是否具有正态性:图(b)表明数据有异常点,应处理掉它重新做回归分析(在SAS的REG回归过程步中用来度量异常点影响大小的统计量是COOKD统计量);图(c)残差随x的增大而增大,图(d)残差随x的增大而先增后减,都属于异方差。此时应该考虑在回归之前对数据y或x进行变换,实现方差稳定后再拟合回归模型。原则上,当误差方差变化不太快时取变换;当误差方差变化较快时取变换logy或lny;当误差方差变化很快时取变换1/y;还有其他变换

6、,如著名的Box-Cox幂变换.图(e)(f)表示选用回归模型是错误的。(2)共线性回归分析中很容易发生模型中两个或两个以上的自变量高度相关,从而引起最小二乘估计可能很不精确(称为共线性问题)。在实际中最常见的问题是一些重要的自变量很可能由于在假设检验中t值不显著而被不恰当地剔除了。共线性诊断问题就是要找出哪些变量间存在共线性关系。SAS的REG过程步提供了特征值法、条件指数collin和方差膨胀因子vif.(3)误差的独立性回归分析之前,要检验误差的独立性。若误差项不独立,那么回归模型的许多处理,包括误差项估计、假设检验

7、等都将没有推导依据。由于残差是误差的合理估计,因此检验统计量通常是建立在残差的基础上。检验误差独立性的最常用方法,是对残差的一阶自相关性进行Durbin-Watson检验。H0:误差项是相互独立的;H1:误差项是相关的检验统计量:DW接近于0,表示残差中存在正自相关;如果DW接近于4,表示残差中存在负自相关;如果DW接近于2,表示残差独立性。在给定显著水平α下,我们可以查Durbin-Watson表得到不能拒绝独立性原假设的区间。四、PROCREG过程步1.基本语法前面三种回归分析都可以用PROCREG过程步实现。基本语法

8、:PROCREGdata=数据集;MODEL因变量=自变量列表;说明:MODEL语句用来指定因变量和自变量;常用的输出可选项:STB——输出标准化偏回归系数矩阵CORRB——输出参数估计矩阵COLLINOINT——对自变量进行共线性分析P——输出个体观测值、预测值及残差(R/CLM/CLI包

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。