资源描述:
《[修订]高中新课程数学(新课标人教a版)选修2-3《311回归分析的基本思想及其初步应用》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、§3.2回归分析(1)教学目标(1)通过实例引入线性回归模型,感受产生随机误差的原因;(2)通过对冋归模型的合理性等问题的研究,渗透线性冋归分析的思想和方法;(3)能求岀简单实际问题的线性回归方程.教学重点,难点线性回归模型的建立和线性回归系数的最佳估计值的探求方法.教学过程一.问题情境1.情境:对一作直线运动的质点的运动过程观测了8次,得到如下表所示的数据,试估计当x=9时的位置y的值.时刻X/s12345678位置观测值y/cm5.547.5210.0211.7315.6916.1216.9821.06根据《数学3(必修)》中的有关
2、内容,解决这个问题的方法是:先作散点图,如下图所示:从散点图中可以看出,样本点呈直线趋势,时间兀与位置观测值y之间有着较好的线性关系.因此可以用线性回归方程來刻画它们Z间的关系.根据线性回归的系数公式,■”b=V£彳一兀(兀)21=1a=y-bx可以得到线性回归方为y=3.5361+2.1214x,所以当x=9时,由线性回归方程可以估计其位置值为y=22.62872.问题:在时刻x=9时,质点的运动位置一定是22.6287c加吗?二.学生活动思考,讨论:这些点并不都在同-•条直线上,上述直线并不能耕确地反映x与y之间的关系,y的值不能山
3、兀完全确定,它们之间是统计相关关系,y的实际值与估计值Z间存在着误差.三.建构数学1.线性冋归模型的定义:我们将川于估计y值的线性两数a^bx作为确定性函数;y的实际值与估计值Z间的误差记为£,称Z为随机误差;将y=a-rbx+E称为线性回归模型.说明:(1)产生随机误差的主要原因有:①所用的确定性两数不恰当引起的谋差;②忽略了某些因素的影响;③存在观测误差.(2)对于线性冋归模熨,我们应该考虑下面两个问题:①模型是否合理(这个问题在下一节课解决);②在模型合理的情况下,如何估计G,/??1.探求线性回归系数的绘佳估计值:对于问题②,
4、设有”对观测数据(兀,必)(i=l,2,3,•••,〃),根据线性回归模型,对于每一个兀,对应的随机误差项勺=X—(0+方兀・),我们希望总误差越小越好,即要使工越小越好.所/=1以,只要求出使取得最小值时的Q,0值作为Q,的估计值,i=记为2,b.注:这里的
5、吕
6、就是拟合直线上的点(兀,°+bxt)到点£(托,X)的距离.用什么方法求2,b?回忆《数学3(必修)》“2.4线性回归方程”P71"热茶问题”中求Q,b的方法:最小二乘法.利用最小二乘法可以得到2,2的计算公式为”工兀)[-m二心】^xf-n(x)2/=1吕一一》(兀一切(
7、开一),)$=Z——工(兀-兀)21=1a=y-bx由此得到的直线y=a+bx就称为这斤对数据的回归直线,此直线方程即为线性回归方程.其中厶,&分别为a,Z?的佔计值,2称为冋归截距,&称为冋归系数,$称为冋归值.在前面质点运动的线性回归方程$=3.5361+2.1214x中,2=3.5361,&=2.1214.1.线性回归方程y=a^bxlla9b的意义是:以d为基数,x每增加1个单位,y相应地平均増加b个单位;2.化归思想(转化思想)在实际问题中,有时两个变疑之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的
8、非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数•下而列举些常见的曲线方程,并给出相应的化为线性冋归方程的换元公式.(1)令y'=yx'=—9则有y'=a+bx'.xx1=Inx,a'=Ina9则有y'=a'^bx'.(3)y=aebx令y1=Iny,x'=x9a1=a则有y'=a^hxh(4)y=aex,令y1=Inyx'=—9a'=a9则冇=x(5)y=a+hx,令y'=y,xr=Inx,则有yl=a+bx'.一.数学运用1.例题:例1.下表给出了我国从1949年至1999年人口数据资料
9、,试根据表屮数据估计我国2004年的人口数.年份19491954195919641969197419791984198919941999人口数/百力5426036727058079099751035110711771246解:为了简化数据,先将年份减左1949,并将所得值用兀表示,对应人口数用y表示,得到下而的数据农:X05101520253035404550y5426036727058079099751035110711771246作出11个点(x,y)构成的散点图,山图可知,这些点在一条直线附近,可以用线性冋归模型y=a+bx+e來
10、表示它们之间的关系.根据公式(1)可得g14.453,V丄527.591.这里的a.b分别为a.b的估计值,因此线性回归方程为$=527.591+14.453兀由于2004年对应的x=55,代入线性回归方程