欢迎来到天天文库
浏览记录
ID:34851180
大小:122.00 KB
页数:4页
时间:2019-03-12
《高中数学一统计案例一道回归分析题的思维拓展与延伸素材北京师范大学版选修》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、一道回归分析题的思维拓展与延伸一、回归分析的基本步骤:(1)画出两个变量的散点图.(2)求回归直线方程.(3)用回归直线方程进行预报.下面我们通过案例,进一步学习、拓展与延伸回归分析的基本思想及其应用.二、举例:例1.从某大学中随机选取8名女大学生,其身高和体重数据如表编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.解:由于问题中要求根据身高预报体重,因此选取身高为自变
2、量x,体重为因变量y.作散点图,如下图从图中可以看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此可以用线性回归方程来近似刻画它们之间的关系.矚慫润厲钐瘗睞枥庑赖。根据公式:(1)(2)4其中,()成为样本点的中心.可以得到.于是得到回归方程.因此,对于身高172cm的女大学生,由回归方程可以预报其体重为(kg).是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.849位,这表明体重与身高具有正的线性相关关系.聞創沟燴鐺險爱氇谴净。三.思维拓展与延伸1.如何描述它们之间线性相关关系的强弱?在必修3中,
3、我们介绍了用相关系数;来衡量两个变量之间线性相关关系的方法.本相关系数的具体计算公式为.残骛楼諍锩瀨濟溆塹籟。当r>0时,表明两个变量正相关;当r<0时,表明两个变量负相关.r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值接近于0时,表明两个变量之间几乎不存在线性相关关系.通常,当r的绝对值大于0.75时认为两个变量有很强的线性相关关系.酽锕极額閉镇桧猪訣锥。在本例中,可以计算出r=0.798.这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的.彈贸摄尔霁毙攬砖卤庑。2.如何理解与间的
4、误差显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg.如下图中的样本点和回归直线的相互位置说明了这一点.謀荞抟箧飆鐸怼类蒋薔。4由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用下面的线性回归模型来表示:厦礴恳蹒骈時盡继價骚。这里a和b为模型的未知参数,e是y与之间的误差.通常e为随机变量,称为随机误差,它的均值E(e)=0,方差D(e)=>0.这样线性回归模型的完整表达式为:(3)茕桢广鳓鯡选块网羈泪。在线性回归模型(3)中,随机误差e
5、的方差护越小,通过回归直线预报真实值y的精度越高.随机误差是引起预报值与真实值y之间的误差的原因之一,大小取决于随机误差的方差.鹅娅尽損鹌惨歷茏鴛賴。另一方面,由于公式(1)和(2)中和为截距和斜率的估计值,它们与真实值a和b之间也存在误差,这种误差是引起预报值与真实值y之间误差的另一个原因.籟丛妈羥为贍偾蛏练淨。3.产生随机误差项e的原因是什么?一个人的体重值除了受身高的影响外,还受许多其他因素的影响.例如饮食习惯、是否喜欢运动、度量误差等.事实上,我们无法知道身高和体重之间的确切关系是什么,这里只是利用线性回归方程来近
6、似这种关系.这种近似以及上面提到的影响因素都是产生随机误差e的原因.預頌圣鉉儐歲龈讶骅籴。因为随机误差是随机变量,所以可以通过这个随机变量的数字特征来刻画它的一些总体特征.均值是反映随机变量取值平均水平的数字特征,方差是反映随机变量集中于均值程度的数字特征,而随机误差的均值为0,因此可以用方差来衡量随机误差的大小.渗釤呛俨匀谔鱉调硯錦。4.用身高预报体重时,需要注意哪些问题?4需要注意下列问题:(1).回归方程只适用于我们所研究的样本的总体.例如,不能用女大学生的身高和体重之间的回归方程,描述女运动员的身高和体重之间的关系
7、.同样,不能用生长在南方多雨地区的树木的高与直径之间的回归方程,描述北方干旱地区的树木的高与直径之间的关系.铙誅卧泻噦圣骋贶頂廡。(2).我们所建立的回归方程一般都有时间性.例如,不能用20世纪80年代的身高体重数据所建立的回归方程,描述现在的身高和体重之间的关系.擁締凤袜备訊顎轮烂蔷。(3).样本取值的范围会影响回归方程的适用范围.例如,我们的回归方程是由女大学生身高和体重数据建立的,那么用它来描述一个人幼儿时期的身高和体重之间的关系就不恰当(即在回归方程中,解释变量x的样本的取值范围为[155cm,170cm〕,而用这
8、个方程计算x-70cm时的y值,显然不合适.)贓熱俣阃歲匱阊邺镓騷。(4).不能期望回归方程得到的预报值就是预报变量的精确值.事实上,它是预报变量的可能取值的平均值.4
此文档下载收益归作者所有