欢迎来到天天文库
浏览记录
ID:49285602
大小:1.86 MB
页数:55页
时间:2020-02-03
《SPSS线性回归分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、SPSS线性回归回归(Regression,或LinearRegression)和相关都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计预测功能。一、回归的原理线性回归的统计原理:两个定距变量的回归是用函数y=f(x)来分析的。我们最常用的是一元回归方程其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。Y=350+20x在统计学中,这一方程中的系数是靠x与y变量的大量数据拟合出来的。XYY=a
2、+bx(x,y)由图中可以看出,回归直线应该是到所有数据点最短距离的直线。该直线的求得即使用“最小二乘方法”,使:在拟合的回归直线方程中,回归系数:表示x每变化一个单位时,x与y共同变化的程度。常数:比如通过上学年数和工资的关系计算得出下列的回归公式:y=472+14.8x可知上学年数每增长1年,工资会增加14.8元;也可推测,上学年数为15年的人,工资收入应为472+14.8*15=694元。二、线性回归的适用条件线性趋势:即自变量与因变量的关系是线性的。独立性:因变量Y的取值相互独立。反映在方程中即残差独立。正态性:即自变量的任何一个线性组合,Y应该服从正态分布。反映在方程中即残
3、差Ei服从正态分布。方差齐性:自变量的任何一个线性组合,Y的方差相同。三、线性回归菜单简介LinearRegression对话框Enter:进入法。默认选项。所有所选自变量都进入回归模型,不作任何筛选。Stepwise:逐步法。根据在Option框中设顶的纳入和排除标准进行变量筛选。具体做法是首先分别计算各自变量X对Y的贡献大小,按由大到小的顺序挑选贡献最大的一个先进入方程;随后重新计算各自变量X对Y的贡献,引入方程,同时考察已在方程中的变量是否由于新变量的引入而不再有统计意义。如果是,则将它剔除。如此重复,直到方程内没有变量可剔除,方程外没有变量可引入为止。Remove:剔除法(移
4、去法)。只出不进。注意其筛选以Block为单位。Backward:向后法。步骤类逐步法,但只出不进。即对已纳入方程的变量按对Y贡献的由小到大依次剔除,每剔除一个变量,重新计算对Y贡献的大小。直到方程中所有变量都符合选入的标准为止。Forward:向前法。与逐步法类似,但只进不出。即对纳入方程的变量不再考察它的显著性。直到方程外变量均达不到进入标准,没有自变量引入方程为止。变量筛选方法的选择应注意1.变量选择不仅仅是数学问题,不能脱离研究的目的进行。2.最好多做尝试,对不同方法之间所结果的差异认真思考。Statistics对话框Plots对话框X轴或Y轴中有一个是因变量标准化的预测值标
5、准化的残差删除的残差修正后的预测值。用户的残差用户的删除的残差输出带有正态曲线的标准化残差的直方图。输出标准化残差的正态概率图。对每一个自变量,会产生一个自变量与因变量残差的散点图,主要用于回归诊断。Options对话框如一个变量的F统计量的p值是小于Entry值的,这个变量就进入模型。如一个变量的F统计量的p值是大于Removal值的,这个变量就从模型中删除。Entry值必须小于Removal值且都为正。如想模型中有更多的变量就提高Entry值;如想模型中减少变量就减少Removal值。用F统计量的值,同上选择此项不显示回归方程中常数项。Save对话框四、回归分析的步骤1.做出散点
6、图,观察变量间的趋势;2.考察数据的分布,进行必要的预处理;3.进行直线回归分析;4.残差分析;5.强影响点的诊断及多重共线性问题的判断。例1:以SPSS自带的数据文件“1991U.S.GeneralSocialSurvey.sav”为例分析影响职业声望的因素。例2:请分析SPSS自带数据文件plastic.sav中变量挤压(extrusn)、附加(addition)、光泽(gloss)、不透明度(opacity)对变量拉扯强度(tear_res)的大小有无影响?已知挤压对拉扯强度的大小有影响。已知压对拉扯强度有影响,故不需筛选,可用进入法。其他变量不知道有无影响,需要用逐步法进行筛
7、选。衡量多元线性回归方程的标准1.复相关系数R与校正复相关系数Rad2.剩余标准差S强影响点的诊断及对策诊断方法:1.散点图2.残差诊断指标3.稳健回归方法的使用对策:1.去除2.变量变换3.非参数分析4.采用加权最小二乘法多重共线性问题及对策确认:1.求相关系数矩阵,系数在0.9以上的将会存在共线性问题,0.8以上可能会有问题;2.容忍度(Tolerance):指标越小,共线性可能越严重。如果小于0.1,可认为共线性严重。对策:1.增大样本,可能部分解决
此文档下载收益归作者所有