回归分析及独立性检验规律小结.doc

回归分析及独立性检验规律小结.doc

ID:48955475

大小:818.50 KB

页数:5页

时间:2020-02-26

回归分析及独立性检验规律小结.doc_第1页
回归分析及独立性检验规律小结.doc_第2页
回归分析及独立性检验规律小结.doc_第3页
回归分析及独立性检验规律小结.doc_第4页
回归分析及独立性检验规律小结.doc_第5页
资源描述:

《回归分析及独立性检验规律小结.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、本章知识结构二、知识要点与联系1.已知回归直线的斜率估计值为k,样本点的中心为(m,n),则回归直线方程为。2.相关指数R2=,R2越表示回归效果越好。3.建立回归模型基本步骤:第一步:第二步:第三步:第四步:第五步:4.三维柱形图中,估计“X与Y有关系”成立的可能性越大的依据是。5.二维条形图中,估计“X与Y有关系”成立的可能性越大的依据是。6.精确判断两个分类变量是否有关系的具体做法是。7.考查某种针剂的预防效果进行试验数据如下:注射针剂的串病12例,未患病48例,未注射针剂的患病22例,未患病35例,则认为针剂无效的可能性约为。三、综合型问题剖析例1:假

2、设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料。使用年限x23456维修费用y2.23.85.56.57.0若由资料知,y对x呈线性相关关系。试求:线性回归方程的回归系数;5解:由已知数据制成表格。i12345合计xi2345620yi2.23.85.56.57.025xiyi4.411.422.032.542.0112.3xi24916253690所以有评注:例2.为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数作解释变量,繁殖个数作预报变量,作出这些数据的散

3、点图;(2)描述解释变量与预报变量之间的关系;(3)计算残差、相关指数R2.解:(1)散点图如右所示天数繁殖个数5(2)由散点图看出样本点分布在一条指数函数的周围,于是令Z=lny,则x123456Z1.792.483.223.894.555.25由计数器算得,则有(3)6.0612.0924.0948.0495.77190.9612254995190即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.评注:例3.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.(1)利用图形判

4、断秃顶与患心脏病是否有关系.(2)能够以99%的把握认为秃顶与患心脏病有关系吗?为什么?解:根据题目所给数据得到如下列联表:(1)相应的三维柱形图如图3.2一4所示.比较来说,底面副对角线上两个柱体高度的乘积要大一些,可以在某种程度上认为“秃顶与患心脏病有关”.5(2)根据题中的数据,得到≈16.373>6.因此有99%的把握认为“秃顶与患心脏病有关”.评注:例4.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:性别与喜欢数学课程列联表喜欢数学课程不喜欢数学课程总计男3785122女35143178总计7

5、2228300由表中数据计算得的观测值.能够以95%的把握认为高中生的性别与是否喜欢数学课程之间有关系吗?请详细阐明得出结论的依据.解:可以有约95%以上的把握认为“性别与喜欢数学课之间有关系”.作出这种判断的依据是独立性检验的基本思想,具体过程如下:分别用a,b,c,d表示样本中喜欢数学课的男生人数、不喜欢数学课的男生人数、喜欢数学课的女生人数、不喜欢数学课的女生人数.如果性别与是否喜欢数学课有关系,则男生中喜欢数学课的比例与女生中喜欢数学课的人数比例应该相差很多,即应很大.将上式等号右边的式子乘以常数因子,然后平方得,其中.因此越大,“性别与喜欢数学课之间有关

6、系”成立的可能性越大.另一方面,在假设“性别与喜欢数学课之间没有关系”的前提下,事件A={≥53.841}的概率为P(≥3.841)≈0.05,因此事件A是一个小概率事件.而由样本数据计算得的观测值k=4.514,即小概率事件A发生.因此应该断定“性别与喜欢数学课之间有关系”成立,并且这种判断结果出错的可能性约为5%.所以,约有95%的把握认为“性别与喜欢数学课之间有关系”.评注:四、规律总结1.作为非确定性关系的相关关系包括两种情况:其一,两个变量中,一个变量为可失控变量,另一个变量为随机变量;其二,两个变量均为随机变量,主要研究第二种情况。2.一元线性回归分析

7、是回归分析中最简单,也是最基本的一种类型,它类似于代数方程理论中的一元一次方程。3.求回归直线方程和相关系数通常是用计算器完成的,列出相应的表格可便于求出回归直线方程中的系数和相关系数。4.对两个变量的线性相关性进行检验,有几种彼此等价的方法,相关系数检验法只是其中一种。5.用随机变量K2的值作2×2列联表的独立性检验时,要求表中的4个数据都要大于5,为此,在选取样本容量时,一定要注意这一点。6.独立性检验的基本思想类似于反证法。要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量

8、K2应

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。