欢迎来到天天文库
浏览记录
ID:45518894
大小:435.50 KB
页数:17页
时间:2019-11-14
《2018-2019学年高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.2 独立性检验的基本思想及其初步应用 1.了解分类变量的意义. 2.了解2×2列联表的意义. 3.了解随机变量K2的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法., 1.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d(1)列联
2、表是两个或两个以上分类变量的汇总统计表,现阶段我们仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为2×2列联表.(2)列联表有助于直观地观测数据之间的关系. 2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=,其中n=a+b+c+d为样本容量.(3)独立性检验的具体做法
3、①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.独立性检验的基本思想与反证法的思想的相似之处反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2 判断正
4、误(正确的打“√”,错误的打“×”)(1)列联表中的数据是两个分类变量的频数.( )(2)对事件A与B的独立性检验无关,即两个事件互不影响.( )(3)K2的大小是判断事件A与B是否相关的统计量.( )答案:(1)√ (2)× (3)√某校为了检验高中数学新课程改革的成果,在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如2×2列联表所示(单位:人),则其中m=________,n=________.80分及80分以上80分以下总计试验班321850对照班24m50总计5644n答案:26 100若两个分类变量X和Y的2×2列联表为:y1
5、y2x1515x24010则X与Y之间有关系的可信度为________.解析:K2的观测值k≈18.8>10.828.故有99.9%的把握认为X与Y有关系.答案:99.9%探究点1 等高条形图的应用 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【解】 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的
6、频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.(1)判断两个分类变量是否有关系的两种常用方法①利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法.②一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大.(2)利用等高条形图判断两个分类变量是否相关的步骤 研究人员选取170名青年男女大学生,对他们进行一种心理测验.发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名
7、.试判断性别与态度之间是否有关系.解:根据题目所给数据建立如下列联表:肯定否定总计女生184260男生2288110总计40130170相应的等高条形图如图所示.比较来看,女生中肯定的人数比要高于男生中肯定的人数比,因此可以在某种程度上认为性别与态度之间有关.探究点2 独立性检验 某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:女男总计喜爱402060不喜爱203050总计6050110试根据样本估计总体的思想,估计约有多大的把握认为“喜爱该节目与否和性
此文档下载收益归作者所有