变量间的相关关系与统计案例

变量间的相关关系与统计案例

ID:9004433

大小:367.02 KB

页数:8页

时间:2018-04-14

变量间的相关关系与统计案例_第1页
变量间的相关关系与统计案例_第2页
变量间的相关关系与统计案例_第3页
变量间的相关关系与统计案例_第4页
变量间的相关关系与统计案例_第5页
资源描述:

《变量间的相关关系与统计案例》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、第3讲 变量间的相关关系与统计案例【2013年高考会这样考】以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单应用.【复习指导】高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.  基础梳理1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关.(3)线性相

2、关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(xn,yn),其回归方程为=x+,则其中,b是回归方程的斜率,a是在y轴上的截距.(1)当r>0时,表明两个变量正相关;(2)当r<0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相

3、关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当

4、r

5、>0.75时,认为两个变量有很强的线性相关关系.4.线性回归模型(1)y=bx+a+e中,a、b称为模型的未知参数;e称为随机误差.(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是:R2=1-,R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好.5.独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量

6、称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dχ2=(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量χ2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.两个规律(1)

7、函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2)当χ2≥3.841时,则有95%的把握说事A与B有关;当χ2≥6.635时,则有99%的把握说事件A与B有关;当χ2≤2.706时,则认为事件A与B无关.三个注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的

8、,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.(3)独立性检验的随机变量χ2=3.841是判断是否有关系的临界值,χ2≤3.841应判断为没有充分证据显示事件A与B有关系,而不能作为小于95%的量化值来判断.双基自测1.(人教B版教材习题改编)下面哪些变量是相关关系(  ).                   A.出租车车费与行驶的里程B.房屋面积与房屋价格C.身高与体重D.铁块的大小与质量解析 A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系.答案 C

9、2.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图(1);对变量u,v有观测数据(ui、vi)(i=1,2,…,10),得散点图(2).由这两个散点图可以判断(  ).A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关解析 由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关.答案 C3.(2012·南昌模拟)某商品销售量y(件)与销售价格x(元/件

10、)负相关,则其回归方程可能是(  ).A.=-10x+200B.=10x+200C.=-10x-200D.=10x-200解析 因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案 A4.(2012·枣庄模拟)下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为(  ).A.94,72B.52,50C.52,74D.74,52

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。