资源描述:
《2019版高考数学大一轮复习第十章统计与统计案例第3节变量的相关性学案理新人教b版》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、第3节变量的相关性最新考纲1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只耍求2X2列联表)的基本思想、方法及其简单应用:4.T解回归分析的基本思想、方法及其简单应用.基础诊断回归教材,夯实基础知识梳理1•变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区
2、域内,两个变量的这种相关关系称为疋相关,点散布在左上角到右下角的区域内,两个变量的相关关系为负相关.2.冋归分析对具有相关关系的两个变量进行统计分析的方法叫回归分析.其基本步骤是:(i)画散点图;(ii)求回归直线方程;(迅)用回归直线方程作预报.(1)回归直线:如果散点图屮点的分布从整体上看大致在一条直线附近,就称这两个变量Z间具有线性相关关系,这条直线叫做回归直线.(2)冋归直线方程的求法一一最小二乘法.设具有线性相关关系的两个变量的一组观察值为(七,y)(i=1•2.*u),则回归直线方程y=N+Ljc的系数为:和71S(r-—
3、3)(乂一3)SD・j—”亍了7i-ii-1S(.仁一77)'S:r-—ti丘‘i—1i—16=—其中二=丄s=丄2加(二,了)称为样本点的中心.m;-in;-i(3)相关系数①计算相关系数厂,厂有以下性质:
4、rKb并且丨厂
5、越接近1,线性相关程度越强;冷越接近5线性相关程度輕;②冷>*“,表明有95%的把握认为变量兀与$之间具有线性相关关系,回归直线方程有意义;否则寻找回归直线方程毫无意义.3・独立性检验⑴2X2列联表BB合计AH11山+A叫1门22毁+合计5n其中刀1+=刀11+刀12,处+=处1+@2,刀+1=刀11+炖1,刀+
6、2=卫吐型,刀=血+血+巾2+处2・⑵"统计量9n(/7hZ722—7712/721)才===_—=;刀1+於+刀+"+2(1)两个临界值:3.841与6.635当宀〉3.&41时,有95%的把握说事件A与〃有关;当*〉6.635吋,有99%的把握说事件月与〃有关;当"W3.841时,认为事件力与3是无关的.[常用结论与微点提醒]1.求解冋归方程的关键是确定冋归系数日,应充分利用冋归直线过样本中心点匕,y).1.根据"的值可以判断两个分类变量有关的可信程度,若乂2越大,则两分类变量有关的把握越大.a2.根据回归方程计算的血,仅是一个预
7、报值,不是真实发生的值.诊断自测1.思考辨析(在括号内打“丿”或“X”)(1)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.()八aa(2)通过回归直线方程日可以估计预报变量的取值和变化趋势.()(3)因为由任何一组观测值都可以求得一个线性回归方程,所以没有必要进行相关性检验.()(4)事件尤,卩关系越密切,则由观测数据计算得到的宀的观测值越大.()答案⑴丿(2)V(3)X(4)V2.(教材例题改编)某研究机构对高三学生的记忆力/和判断力y进行统计分析,所得数据如表:X681012V2356则F对/的线性回归直线方程
8、为()A.y=2.3%—0.7B.y=2.3x+0.7C.尸0.lx-2.3D.尸0.7卄2.3解析易求兀=9,y=4,样本点屮心(9,4)代入验证,满足y=0.7x—2.3.答案C3.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数#如下,其中拟合效果最好的模型是()A.模型1的相关指数#为0.98B•模型2的相关指数#为0.80C.模型3的相关指数#为0.50D.模型4的相关指数#为0.25解析在两个变量y与x的冋归模型中,它们的相关指数#越近于1,模拟效果越好,在四个选项屮A的相关指数最大,所以拟合效果最好的是
9、模型1.答案A1.(2015・全国II卷)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以來我国二氧化硫年排放量与年份正相关解析对于A选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A正确.对于B选项,由图知,由2006年到2007年矩形高度明显下降,因此B正确.对于C选项,由图知从2006年以后除2011年稍
10、有上升外,其余年份都是逐年下降的,所以C正确.由图知2006年以來我国二氧化硫年排放量与年份负相关,D不正确.答案D2.为了判断高屮三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2X2列联表:根据表屮