欢迎来到天天文库
浏览记录
ID:59212885
大小:676.50 KB
页数:57页
时间:2020-09-26
《第9章 SPSS 线性回归分析ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第9章SPSS的线性回归分析9.1回归分析概述9.2线性回归分析和线性回归模型9.3回归方程的统计检验9.4多元回归分析中的其他问题9.5线性回归分析的基本操作9.6线性回归分析的应用举例学习的内容与目标掌握线性回归分析的主要指标,了解最小二乘法的基本思想熟练掌握线性回归分析的具体操作,读懂分析结果;掌握计算结果之间的数量关系,写出回归方程,对回归方程进行各种统计检验了解多元回归分析中自变量筛选的策略,以及对应结果的分析了解SPSS残差分析和多重共线检测的基本操作,并能分析结果9.1回归分析概述9.1.1什么是回归分析“回归”一词最初源于英国统计学家F.Gal
2、ton(高尔顿)描述父亲的身高和其成年儿子身高之间的关系,发现成年儿子的身高会趋向于子辈身高的平均值,F.Galton称这种现象为“回归”。用于分析事物之间的统计关系,并通过回归方程的形式描述变量间的数量变化规律,帮助人们准确把握变量受一个或多个变量的影响程度,进而为预测提供依据。回归分析和相关分析1.相关分析变量性质:都是随机变量且关系对等分析方法:图表法(散点图)和相关系数分析目的:判定变量之间相关方向和关系的密切程度2.回归分析变量性质:自变量(确定型变量)和因变量(随机变量)的关系且不对等分析方法:建立回归模型分析目的:研究变量间数量依存关系9.1.2
3、如何得到回归线函数拟合首先,通过散点图观察变量之间的统计关系,得到对回归线的感性认知,并据之确定最简洁的数学函数(回归模型);其次,利用样本数据在一定的拟合准则下,估计回归模型中各个参数,得到确定的回归方程;最后,由于回归参数是在样本数据的基础上得到的,存在随机性。因此需要进行各种检验。9.1.3回归分析的一般步骤确定回归方程中的解释变量(父亲身高x)和被解释变量(儿子身高y)确定回归模型(线性与非线性)建立回归方程,并估计出模型中的参数对回归方程进行各种检验利用方程进行预测9.2线性回归分析和线性回归模型观察被解释变量y和一个或多个解释变量xi的散点图,当发
4、现y与xi之间呈现出显著的线性关系时,应采用线性回归分析的方法,建立y关于xi的线性回归模型。线性回归模型可分为:一元线性回归模型多元线性回归模型9.2.1一元线性回归模型(只有1个解释变量)数学模型为:y=β0+β1x+ε上式表明:y的变化可由两部分解释:第一,由解释变量x的变化引起的y的线性变化部分,即y=β0+β1x;第二,由其他随机因素引起的y的变化部分,即ε。β0、β1都是模型中的未知参数,β0为回归常数,β1为y对x回归系数(即x每变动一个单位所引起的y的平均变动)。ε称为随机误差。且满足:E(ε)=0,Var(ε)=σ2。一元线性回归方程:E(y
5、)=β0+β1x表明x和y之间的统计关系是在平均意义下表述的。估计的一元线性回归方程:估计方程是平面上的一条直线,即回归直线。参数分别代表回归直线的截距和斜率。cbbˆˆ10ˆ+=y9.2.2多元线性回归模型多元数学模型:y=β0+β1x1+β2x2….+βpxp+ε多元线性回归方程:E(y)=β0+β1x1+β2x2….+βpxp估计多元线性回归方程:^^^^^y=β0+β1x1+β2x2….+βpxp9.2.3回归参数的最小二乘估计(ordinaryleastsquareestimation,OLSE)估计思想:使每个样本点(xi,yi)与回归线上的对应点
6、(xi,E(yi))在垂直方向上偏差距离的二次方总和达到最小的原则来估计参数即,∑(yi-E(yi))2=最小一元二乘估计:多元二乘估计(略)9.3回归方程的统计检验拟合优度检验回归方程的显著性检验回归系数的显著性检验残差分析9.3.1回归方程的拟合优度检验用于检验样本数据点聚集在回归线周围的密集程度,从而评价回归线对样本数据的代表程度。思想:因变量y(儿子身高)取值的变化受两个因素的影响:自变量x(父亲身高)不同取值的影响,其他因素(环境、饮食等)的影响。可表示如下:因变量总变差=自变量引起的+其他因素引起的即因变量总变差=回归方程可解释的+不可解释的即,因
7、变量总离差平方和SST=回归平方和SSA+剩余平方和SSEYi图示:一、一元线性回归方程拟合优度的检验采用R2统计量,称为判定系数R2=SSA/SST=1-SSE/SST.R2体现了回归方程所能解释的因变量变差的比例;1-R2体现了回归方程所无法解释的变差比例。R2越接近于1,则说明回归平方和占了绝大部分比例,因变量y的变差主要由自变量x的取值造成,回归方程对样本数据点拟合得好在一元线性回归中,判定系数R2=相关系数r2;因此,从这个意义上讲,判定系数能够比较好地反映回归直线对样本数据的代表程度和线性相关性。说明二、多元线性回归方程多元线性回归方程的拟合优度检
8、验采用统计量,称为调整的判定系数调整的
此文档下载收益归作者所有