欢迎来到天天文库
浏览记录
ID:59211012
大小:872.50 KB
页数:45页
时间:2020-09-26
《第8章 回归分析-SPSS操作方法ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、SPSS统计软件——回归分析1在教育研究中,常常会遇到彼此有关系的两列或多列变量。根据不同的目的,可以从不同的角度去分析变量之间的关系。上一章介绍的相关分析,旨在分析变量之间关系的强度,可以找到一个度量这种关系强度的指标——相关系数。2假设两个变量X和Y的相关显著,说明这两个变量有某种程度的共变关系,现希望通过X的值去预测Y的值,或者希望了解Y的变化在多大程度上可以由X的变化来解释。这时,称Y为因变量(dependentvariable),X为自变量(independentvariable)或预测变量。如果
2、我们的目的是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式,叫做回归分析(regressionanalysis)。3高尔顿(F.Galton.1822-1911)回归分析的基本思想和方法以及回归这一名称的由来都要归功于英国统计学家高尔顿。高尔顿和他的学生皮尔逊在研究父母身高与其子女身高的遗传问题时,考察了1078对夫妇。以每对夫妇的平均身高作为自变量,取他们的一个成年儿子的身高为因变量,结果发现两者近乎一条直线,其回归直线方程为:4这一回归方程表明父母身高每增加一个单位时,其成年儿子的身
3、高也平均增加0.516个单位。这个结果表明,虽然高个子父辈有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。反之,矮个子父辈的确有生矮个子儿子的趋势,但父辈身高减少一个单位,儿子身高仅减少半个单位左右。平均来说,一群高个子父辈的儿子们在同龄人中平均仅为略高个子;一群矮个子父辈的儿子们在同龄人中平均仅为略矮个子,即父辈偏离中心的部分在子代被拉回来一些。正是因为子代的身高有回到同龄人平均身高的这种趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高,其子女更高,父辈个子矮,其子女
4、更矮的两极分化现象。高尔顿引进了回归这个词来描述父辈身高与子代身高的关系。5回归分析的应用非常广泛,建立了变量之间关系的数学模型,实际上就等于确定了自变量与因变量的关系模型,利用这个数学模型,可以从一个变量的变化来预测或估计另一个变量的变化。在实际应用中,根据变量的个数、变量的类型以及变量之间的相关关系,回归分析有很多种类型。我们主要介绍比较常用的一元线性回归分析。当然,如今的回归分析已远远超过当年高尔顿使用该词时的涵义,已成为统计学中一个专用的名词。其根本目的,是要借助于因变量和自变量的分类,在概率统计的
5、意义上,把变量间的相关关系用精确的数学公式伴以其他手段加以进一步的定量刻画。68.1.1回归线前一章介绍了相关散点图,可以发现各点不都在一条直线上。但如果散点的分布有明确的直线趋势,我们就可以配置一条最能代表散点图上分布趋势的直线,这条最优拟合线就称为回归线。8.1回归分析的基本原理常用的拟合这条回归线的原则,就是使各点与该线纵向距离的平方和最小。78.188.1.2回归方程回归分析的数学模型是:基本假设:因变量y受到我们已知的的k个自变量x1,x2,x3,…,xk的影响,同时还受到一些未知因素或随机因素的
6、影响。9每一组实际观察值yi,x1i,x2i,x3i,…,xkiε服从均数为零的正态分布因变量y也服从正态分布,其平均数记为:上式称为回归方程,确定回归线的方程即为回归方程。回归分析的主要任务就是要求出这个回归方程右边的函数表达式,也就是求回归方程。10在回归分析中,根据所求回归方程函数类型的不同,可分为线性回归分析和非线性回归分析两个大类;又可根据内含自变量个数为一个还是多个而分为一元回归分析和多元回归分析两大类。118.1.3一元线性回归方程一元线性回归方程的通式为:式中a回归线在Y轴上的截距;b是回归
7、线的斜率,称回归系数。一旦b和a这两个关键的统计量的值,根据实测数值计算出来之后,这个方程就确定了。12回归方程的求法:最小二乘法,就是应该使误差的平方和最小。当我们做出散点图后,发现无论哪条直线也不可能使所有的散点都在其上。那么哪条直线最有代表性呢,根据最小二乘法,如果每一点沿Y轴方向到直线的距离的平方和最小,则这条直线在所有的直线中代表性是最好的,它的表达式就是所要求的回归方程。13根据上面所说的最小二乘法,其公式为:把代入上式,得:14求回归方程就是求当上式达到最小时a与b的值,而要使上式最小,需分别
8、对a与b求偏导数,并令其等于零。由于这部分涉及到高数里的内容,我们不过多介绍,只需明白原理就行了。最后求得b和a的公式分别是:15求出a和b之后,可以列出回归方程式:168.1.4一元线性回归方程的检验根据样本数据计算出的回归方程可能有一定的抽样误差。为了考查这两个变量在总体上是否存在线性关系,以及回归方程对估计预测因变量的有效性如何,在回归方程应用之前,首先应进行显著性检验。17一元线性回归方程的显著性,有以下
此文档下载收益归作者所有