欢迎来到天天文库
浏览记录
ID:11819440
大小:751.50 KB
页数:0页
时间:2018-07-14
《2017-2018学年高中数学 第一章 统计案例 1.2 独立性检验的基本思想及其初步应用创新应用学案 新人教a版选修1-2》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、1.2 预习课本P10~15,思考并完成以下问题1.分类变量与列联表分别是如何定义的? 2.独立性检验的基本思想是怎样的? 3.独立性检验的常用方法有哪些? 1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的不同类型,像这样的变量称为分类变量.(2)列联表:①列出的两个分类变量的频数表,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+
2、c+d在2×2列联表中,如果两个分类变量没有关系,则应满足ad-bc≈0,因此
3、ad-bc
4、越小,关系越弱;
5、ad-bc
6、越大,关系越强.2.等高条形图等高条形图与表格相比,图形更能直观地反映出两个分类变量间是否相互影响25,常用等高条形图展示列表数据的频率特征.3.独立性检验的基本思想(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式:K2=,其中n=a+b+c+d为样本容量.1.判断下列命题是否正确.(正确的打“√”,错误的打“×”)(1)分类变量中的变量与函数中的变量是
7、同一概念.( )(2)列联表频率分析法、等高条形图可初步分析两分类变量是否有关系,而独立性检验中K2取值则可通过统计表从数据上说明两分类变量的相关性的大小.( )(3)独立性检验的方法就是反证法.( )答案:(1)× (2)√ (3)×2.与表格相比,能更直观地反映出相关数据总体状况的是( )A.列联表 B.散点图C.残差图D.等高条形图答案:D3.如果有99%的把握认为“X与Y有关系”,那么具体算出的数据满足( )附表:P(K2≥k0)0.050.0250.0100.0050.001k03
8、.8415.0246.6357.87910.828A.k>6.635B.k>5.024C.k>7.879D.k>3.841答案:A4.下面是一个2×2列联表:y1y2总计x1a2173x222527总计b46100则表中a,b的值分别为________.答案:52,5425等高条形图的应用[典例] 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照
9、组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?[解] 等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率.由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.在等高条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占的比例,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大. [活学活用]某学校对高三学生作了一
10、项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.解:作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计426594102025相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前紧张与性格
11、类型有关.两个变量的独立性检验[典例] 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.能否在犯错误的概率不超过0.1的前提下,认为“学生选报文、理科与对外语的兴趣有关”?[解] 根据题目所给的数据得到如下列联表:理科文科总计有兴趣13873211无兴趣9852150总计236125361根据列联表中数据由公式计算得随机变量K2的观测值k=≈1.871×10-4.因为1.8
12、71×10-4<2.706,所以在犯错误的概率不超过0.1的前提下,不能认为“学生选报文、理科与对外语的兴趣有关”.独立性检验的步骤(1)确定分类变量,获取样本频数,得到列联表.(2)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.(3)利用公式K2=计算随机变量K2的观测值k0.25(4)作出判断.如果k≥k0,就推断“X
此文档下载收益归作者所有