欢迎来到天天文库
浏览记录
ID:11432885
大小:246.50 KB
页数:5页
时间:2018-07-12
《第八讲 变量间的相关关系、回归分析与独立性检验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第八节变量间的相关关系、回归分析与独立性检验学习目标:会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程;了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题:(1)独立性检验—了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;(2)回归分析—了解回归的基本思想、方法及其简单应用。一、例题分析:例1、1、下面变量是线性相关的是()A.人的身高与视力B.角的大小与所对的圆弧长C.收入水平与纳税水平D.人的年龄与身高2、(09宁夏
2、海南)对变量x,y有观测数据理力争(,)(i=1,2,…,10),得散点图1;对变量u,v有观测数据(,)(i=1,2,…,10),得散点图2.由这两个散点图可以判断。(A)变量x与y正相关,u与v正相关(B)变量x与y正相关,u与v负相关(C)变量x与y负相关,u与v正相关(D)变量x与y负相关,u与v负相关小结:1.两类变量关系类型:函数关系和相关关系,它们的区别在于是确定性关系还是非确定性关系,通过散点图可以判断两个变量之间是否具有相关关系:①如果所有的样本点都落在某一函数曲线上,则变量之间具有函数关系;②如果所有的样本点都落在某
3、一函数曲线附近,则变量之间具有相关关系;③如果所有的样本点都落在某一直线附近,则变量之间具有线性相关关系2.正相关与负相关:若一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关;若一个变量的值由小变大时,另一个变量的值却由大变小这种相关称为负相关.利用散点图判断正、负相关:①如果散点图中的点散布在从左下角到右上角的区域内,称为正相关;②如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。例2.(11安徽文)某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万
4、吨)236246257276286(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程;(Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地2012年的粮食需求量。52、(11陕西理9)设(,),(,),…,(,)是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是A.和的相关系数为直线的斜率B.和的相关系数在0到1之间C.当为偶数时,分布在两侧的样本点的个数一定相同D.直线过点小结:1、回归直线:设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线方程为
5、=x+,则=,我们将这个方程叫做回归直线方程,a,b叫做回归系数,相应的直线叫做回归直线。2、使样本数据点到回归直线的距离的平方和Q=(-b-a)+(-b-a)+…+(-b-a)(即残差平方和)为最小的方法叫最小二乘法。3、求回归直线方程的一般步骤:①作散点图,判断散点是否在一条直线附近.②如果散点在一条直线附近,利用公式计算a,b,并写出回归直线方程,③利用回归方程,由一个变量的值,预测或控制另一个变量的取值.例3.1、下列四个命题中正确的是()①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越小;②残差平方和越小的模
6、型,拟合的效果越好;③用相关指数来刻画回归效果,越小,说明模型的拟合效果越好.④随机误差e是衡量预报精确度的一个量,它满足E(e)=0A.①③B.②④C.①④D.②③2、(09辽宁)某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在(29.94,30.06)的零件为优质品。从两个分厂生产的零件中个抽出500件,量其内径尺寸,得结果如下表:甲厂5(1)试分别估计两个分厂生产的零件的优质品率;(2)由于以上统计数据填下面列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”。甲厂乙厂合计优质品非优质品合计0.0
7、0000000附:小结:1、相关关系:,若,则正相关很强,若,则负相关很强。2、用相关指数来刻画回归效果,,越大,拟合效果越好。3、独立性检验指标,当时,有95%的把握说事件A与B有关;当时,有99%的把握说事件A与B有关。二、体验高考:1、(11山东理7)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程中的为9.45,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元2、(11湖南理4)通过随机询问110名
8、性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由算得,.0.0500.0100.0013.8416.63510.828参照附表,得到的正确结
此文档下载收益归作者所有