欢迎来到天天文库
浏览记录
ID:11833235
大小:248.00 KB
页数:13页
时间:2018-07-14
《高中数学 第三章 统计案例 . 独立性检验的基本思想及其初步应用学案 新人教a版选修-》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、3.2 独立性检验的基本思想及其初步应用[学习目标]1.了解独立性检验的基本思想、方法及其简单应用;2.理解判断两个分类变量是否有关系的常用方法、独立性检验中K2的含义及其实施步骤.[知识链接]1.举例说明什么是分类变量?答 变量的不同“值”表示个体所属的不同类别的变量称为分类变量,分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等等.2.什么是列联表?怎样从列联表判断两个分类变量有无关系?答 一般地,假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},列出两个变量的
2、频数表,称为列联表(如下图)y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d
3、ad-bc
4、越小,说明两个分类变量x,y之间的关系越弱;
5、ad-bc
6、越大,说明两个分类变量x,y之间的关系越强.[预习导引]1.分类变量和列联表(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表称为列联表.②2×2列联表一般地,假设两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},13其样本频数列联表(也称为2×2列联表)为下表.y1y2总计x1aba+bx2cdc+d总
7、计a+cb+da+b+c+d2.等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系.3.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)K2=,其中n=a+b+c+d.(3)独立性检验的具体做法①根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率
8、不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.要点一 有关“相关的检验”例1 某校对学生课外活动进行调查,结果整理成下表:用你所学过的知识进行分析,能否在犯错误的概率不超过0.005的前提下,认为“喜欢体育还是文娱与性别有关系”?体育文娱总计男生212344女生6293513总计275279解 判断方法如下:假设H0“喜欢体育还是喜欢文娱与性别没有关系”,若H0成立,则K2应该很小.∵a=21,b=23,c=6,d=29,n=79,∴K2==≈8.106.且P(K2≥7.879)
9、≈0.005即我们得到的K2的观测值k≈8.106超过7.879,这就意味着:“喜欢体育还是文娱与性别没有关系”这一结论成立的可能性小于0.005,即在犯错误的概率不超过0.005的前提下认为“喜欢体育还是喜欢文娱与性别有关”.规律方法 (1)利用K2=求出K2的观测值k的值.再利用临界值的大小来判断假设是否成立.(2)解题时应注意准确代数与计算,不可错用公式,准确进行比较与判断.跟踪演练1 为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查得到如下数据:成绩优秀成绩较差总计兴趣浓厚的643094兴趣不浓厚的227395总计86103189判断学生的
10、数学成绩好坏与对学习数学的兴趣是否有关?解 由公式得K2的观测值k=≈38.459.∵38.459>10.828,∴有99.9%的把握说学生学习数学的兴趣与数学成绩是有关的.要点二 有关“无关的检验”例2 为了探究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高二在校学生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人.分析学生选报文、理科与对外语的兴趣是否有关?解 列出2×2列联表理文总计13有兴趣13873211无兴趣9852150总计236125361代入公式得K2的观测值k=≈1.87
11、1×10-4.∵1.871×10-4<2.706,∴可以认为学生选报文、理科与对外语的兴趣无关.规律方法 运用独立性检验的方法:(1)列出2×2列联表,根据公式计算K2的观测值k.(2)比较k与k0的大小作出结论.跟踪演练2 第16届亚运会于2010年11月12日至27日在中国广州进行,为了搞好接待工作,组委会招募了16名男志愿者和14名女志愿者,调查发现,男、女志愿者中分别有10人和6人喜爱运动,其余人不喜爱运动.(1)根据以上数据完成以下2×2列联表:喜爱运动不喜爱运动总计男1016女614总计30(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.1
此文档下载收益归作者所有