数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)

数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)

ID:36375666

大小:978.50 KB

页数:44页

时间:2019-05-10

数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)_第1页
数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)_第2页
数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)_第3页
数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)_第4页
数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)_第5页
资源描述:

《数学:1.1《回归分析的基本思想及其初步应用》课件(新人教a版选修1-2)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、回归分析的基本思想及其初步应用一、复习回顾:1、求线性回归方程2、线性相关关系强弱的判断:相关系数r例1:从某大学中随机选取8名女大学生,其身高和体重数据如下表,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.编号12345678身高cm165165157170175165155170体重kg4857505464614359线性回归模型:y=0.849x-85.712+e身高、随机误差对体重有没有影响?二、新概念引入:计算例1中总偏差平方和SST=354思考:预报变量(体重)与实际

2、值有偏差即总偏差平方和,这个偏差变化在多大程度上与解释变量(身高)有关?在多大程度上与随机变量有关?作用:表示随机误差的效应残差平方和:样本值与回归值差的平方和2.残差:样本值与回归值差即例1SSE=128.361思考:若体重仅受身高的影响,散点图又如何?3.回归平方和:相应回归值与样本均值差的平方和,即:SST=SSR+SSE作用:表示解释变量的效应例1SSR=225.639即刻画了预报变量的变化中由解释变量通过线性回归模型所引起的那部分变化程度注:当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模

3、型的拟合效果越好.SST=SSR+SSE4.有没有其他方法来刻划模型的拟合程度?相关指数:1)R2越大,说明残差平方和越小,回归平方和越大,则模型拟合效果越好。2)R2表示解释变量对预报变量变化的贡献率3)R2→1,模型拟合效果越好,表示解释变量和预报变量的相关性越强。例1相关指数R2=0.64,说明了什么?解释变量对总效应约贡献了64%,随机误差贡献了剩余的36%。4)若采用了几种不同回归方程进行回归分析,通过比较R2值作出选择,即选择R2大的模型作为这组数据的模型。问:有些时候,样本数据中难免混有错误数据,通过何

4、种方法把它剔除?5、残差分析:判断原始数据中是否存在可疑数据,这方面的工作称为残差分析。步骤:1)计算每组数据的残差2)画残差图。纵坐标为残差,横坐标为自变量。3)分析残差图4)找异常值练:例1作出残差分析即样本值减预测值残差比较均匀地落在带状区域内,说明选用的模型比较合适。但第1个点与第6个点残差较大,需要分析。-202-405-505-50-50回归模型合理回归模型不是最好回归模型不是最好回归模型不是最好例1用身高预测体重要注意的问题:(1)回归方程所适用样本的总体(2)回归方程所适用的时间性(3)回归方程所适用

5、的范围(4)回归方程得到的是预报变量可能取值的平均值编号123456…Xx1x2x3x4x5x6…Yy1y2y3y4y5y6…据R2大小(作残差表或图)残差分析据r的大小判定相关性应用(解释变量)相关性判定公式残差分析公式例1小结建立回归模型的步骤:(1)明确研究对象,设好变量(2)画出散点图(3)选定回归方程类型(4)求回归方程中的参数(5)作残差图,进行残差分析例2关于x与y有如下数据:x24568y3040605070为了对x、y两个变量进行统计分析,现有以下两种线性模型:y=6.5x+17.5,y=7x+17

6、,试比较哪一个模型拟合的效果更好.1)总偏差平方和=回归平方和+残差平方和2)判断两个模型拟合程度:相关指数R23)如何进行残差分析?4)求回归模型的步骤。小结例1从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。案例1:女大学生的身高与体重解:1、选取身高为自变量x,体重为因变量y,作散点图:

7、2、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。3、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系。我们可以用下面的线性回归模型来表示:y=bx+a+e,其中a和b为模型的未知参数,e称为随机误差。思考P3产生随机误差项e的原因是什么?思考P3产生随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、其它因素的影响:影响身高y的因素不只是体重x,可能还包括遗传基因、饮食习惯、生长环境等因素;2、用线性

8、回归模型近似真实模型所引起的误差;3、身高y的观测误差。函数模型与回归模型之间的差别函数模型:回归模型:可以提供选择模型的准则函数模型与回归模型之间的差别函数模型:回归模型:线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化。在统计中,我们也把自变量x称为解析变量,因变量

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。