欢迎来到天天文库
浏览记录
ID:37002518
大小:1.16 MB
页数:39页
时间:2019-05-11
《【数学】3.1.1回归分析的基本思想及其初步应用(1)》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.1回归分析的基本思想及其初步应用(一)高二数学选修2-3必修3(第二章统计)知识结构收集数据(随机抽样)整理、分析数据估计、推断简单随机抽样分层抽样系统抽样用样本估计总体变量间的相关关系用样本的频率分布估计总体分布用样本数字特征估计总体数字特征线性回归分析统计的基本思想实际样本模拟抽样分析问题1:正方形的面积y与正方形的边长x之间的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-------有一个确定性的关系?例如:在7块并排、形状大小相同的试验田上进行施肥量对水稻产量影响的试验,
2、得到如下所示的一组数据:施化肥量x15202530354045水稻产量y330345365405445450455复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1)相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2)2、现实生活中存在着大量的相关关系。如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?102030405050045
3、0400350300·······发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455散点图1020304050500450400350300·······xy施化肥量水稻产量oxy易知,截距和斜率分别是使取最小值时的值。假设我们已经得到两个具有相关关系的变量的一组数据且回归方程是:其中,是待定参数。当变量x取时它与实际收集到的之间的偏差是
4、最小二乘法:称为样本点的中心。3、对两个变量进行的线性分析叫做线性回归分析。2、回归直线方程:2.相应的直线叫做回归直线。1、所求直线方程叫做回归直---线方程;其中相关系数1.计算公式2.相关系数的性质(1)
5、r
6、≤1.(2)
7、r
8、越接近于1,相关程度越大;
9、r
10、越接近于0,相关程度越小.问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?正相关负相关相关系数r>0正相关;r<0负相关.通常,r∈[-1,-0.75]--负相关很强;r∈[0.75,1]—正相关很强;r∈[-0.75,-0.3]--负
11、相关一般;r∈[0.3,0.75]—正相关一般;r∈[-0.25,0.25]--相关性较弱;·······1020304050500450400350300xy施化肥量水稻产量施化肥量x15202530354045水稻产量y330345365405445450455解:1.画出散点图3.写出回归方程4.计算相关系数2.求出某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学
12、生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量.1.散点图;样本点呈条状分布,身高和体重有较好的线性相关关系,因此可以用回归方程来近似的刻画它们之间的关系.由得:故所求回归方程为:因此,对于身高172cm的女大学生,由回归方程可以预报其体重为:是斜率的估计值,说明身高x每增加1个单位时,体重y就增加0.849个单位,这表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强弱?相关系数相关系数的性质(
13、1)
14、r
15、≤1.(2)
16、r
17、越接近于1,相关程度越强;
18、r
19、越接近于0,相关程度越弱.注:b与r同号问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?相关系数r>0正相关;r<0负相关.通常,r>0.75,认为两个变量有很强的相关性.本例中,由上面公式r=0.798>0.75.某大学中随机选取8名女大学生,其身高和体重数据如下表所示.编号12345678身高/cm165165157170175165155170体重/kg4857505464614359求根据女大学生的身高预报体重的回归方程,并预报一
20、名身高为172cm的女大学生的体重.故所求回归方程为:r=0.798表明体重与身高有很强的线性相关性,从而说明我们建立的回归模型是有意义的.认为她的平均体重的估计值是60.316kg.因为所有的样本点不共线,所以线性函数模型只能近似地刻画身高和体重之间的关系,即:体重不仅受身高的影响,还受其他因素的影响,把这种影响的结果用e来表示,从而把线性函数模型修改为线性回归模型:y=bx+a+e.其中,e包含
此文档下载收益归作者所有