资源描述:
《【教学课件】《最小二乘估计》(北师大)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、本课时编写:吉林省前郭县长山镇中学校王亚飞老师第一章·统计最小二乘估计北京师范大学出版社
2、必修三高二某班学生每周用于数学学习的时间x(单位:h)与数学成绩y(单位:分)之间有如下数据:x24152319161120161713y92799789644783687159某同学每周用于数学学习的时间为18h,试预测该生数学成绩。o1012141618202224406080100yx新课导入o1012141618202224406080100yx选择怎样的直线近似地表示用于数学学习的时间与数学成绩之间的关系?如果有n个点(x1,y1),(x2,y2),…
3、,(xn,yn),可以用下面的表达式来刻画这些点与直线y=a+bx的接近程度:使得上式达到最小值的直线y=a+bx就是我们要求的直线,这种方法称为最小二乘法。如果用表示用表示则可以求得这样得到的直线方程y=a+bx称为线性回归方程,a,b是线性回归方程的系数线性回归方程必有解___________探索新知某小卖部6天卖出热茶的杯数(y)与当天的气温(x)之间是线性相关的。数据如下表:气温(xi)/oC261813104-1杯数(yi)/杯202434385064(1)试用最小二乘法求出线性回归方程;(2)如果某天的气温是-5oC,请预测这天可能会卖出
4、热茶多少杯。质疑答辩,发展思维ixiyixi2xiyi126206765202182432443231334169442410381003805450162006-1641-64合计7023012861910解:(1)根据要求列出表格,计算得由系数公式得,于是,线性回归方程为:从散点图可以看出,某小卖部6天卖出热茶的杯数(y)与当天的气温(x)之间是线性相关的。数据如下表:气温(xi)/oC261813104-1杯数(yi)/杯202434385064(1)试用最小二乘法求出线性回归方程;(2)如果某天的气温是-5oC,请预测这天可能会卖出热茶多少杯
5、。解:(2)当某天的气温是-5oC时,卖出热茶的杯数估计为:注意:尽管我们利用线性回归方程所得到值仅是一个估计值,具有随机性,但我们是根据统计规律得到的,因而所得结论正确的概率是最大的,故我们可以放心大胆地利用线性回归方程进行预测。质疑答辩,发展思维根据(1)得到的线性回归方程利用线性回归方程对总体进行估计(1)求线性回归方程y=a+bx:(2)利用线性回归方程,我们可以进行预测,并对总体进行估计。即在x=x0处的估计值为y=a+bx0①列表求,,x1y1+x2y2+···+xnyn的值;②由;求系数a和b。用最小二乘法推导3个点的线性回归方程设有3
6、个点(x1,y1),(x2,y2),(x3,y3),则有最小二乘法可知直线y=a+bx与这3个点的接近程度由下面表达式刻画:(※)把(※)式整理为关于a的二次函数f(a),即函数f(a)达到最小值。将a代入(※)式,整理成为关于b的二次函数g(b)即从而当时,从而当时,函数g(b)达到最小值。从而得到3个点(x1,y1),(x2,y2),(x3,y3)的线性回归方程:例下面是两个变量的一组数据:x12345678y1491625364964请用最小二乘法求出这两个变量之间的线性回归方程注意:在本题中,从所给的数据中我们不难看出,满足函数y=x2,是一
7、条曲线,而我们利用最小二乘法进行估计时,所求出的是一条直线,因而估计也就失去了意义。xyo12345678910203040506070利用最小二乘法估计时,要先作出散点图。如果散点图呈现一定的规律性,我们再根据这个规律性进行拟合,如果散点图呈现出线性关系,我们可以用最小二乘法估计出线性回归方程;如果散点图呈现出其他的曲线关系,我们就要利用其他的工具进行拟合。例题讲解巩固练习【解析】选D结合对数函数图像的特点以及散点图中样本点的分布规律可判断。(1)某研究小组在一项实验中获得一组关于y、t之间的数据,将其整理后得到如图的散点图,下列函数中,最能近似刻
8、画y与t之间关系的是()A、y=2tB、y=2t2C、y=t3D、y=log2tD日期9.19.29.39.49.59.6人数100109115118121131日期9.79.89.99.109.119.12人数141152158175186203(2)2013年秋季,我国部分地区发生甲型流感,党和政府采取果断措施,使疫情得到控制。下表是某体检站记录的9月1日~9月12日体检中发烧人数,并给出散点图如图下列说法:①根据此散点图,可以判断日期与发烧人数具有线性相关关系;②根据此散点图,可以判断日期与发烧人数具有一次函数关系。其中正确的是________
9、__。【解析】由散点图可以发现样本点大致分布在一条直线附近,所以可以判断日期与发烧人数具有线性相关关系。答案