欢迎来到天天文库
浏览记录
ID:29200050
大小:2.14 MB
页数:13页
时间:2018-12-17
《高二数学独立性检验知识精讲 苏教版》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、高二数学独立性检验知识精讲苏教版一.本周教学内容:独立性检验教学目的:了解独立性检验(只要求2×2列联表)的基本思想、方法及初步应用。教学重点:能用独立性检验的方法解决实际问题。教学难点:独立性检验的思想。二.知识结构:1.独立性检验(1)独立性检验流程图:抽取样本提出统计假设运用检验.(2)独立性检验的其他方法。(3)独立性检验的基本思想类似反证法。①假设结论不成立,即“两个分类变量没有关系”.②在此假设下随机变量应该很小,如果由观测数据计算得到的观测值k很大,则在一定程度上说明假设不合理.③根据随机变量K2的含义,可以通过
2、评价该假设不合理的程度,由实际计算出,2.假设检验问题的原理(1)问题:数学家庞加莱每天都从一家面包店买一块1000g的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g;“这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件;这个小概率事件的发生使庞加莱得出推断结果。(2)假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用表示;另一个叫做
3、备择假设,用表示。例如,在前面的例子中,原假设为::面包分量足,备择假设为:面包分量不足。这个假设检验问题可以表达为::面包分量足:面包分量不足3.求解假设检验问题考虑假设检验问题::面包分量足:面包分量不足求解思路:(1)在成立的条件下,构造与矛盾的小概率事件;(2)如果样本使得这个小概率事件发生,就能以一定把握断言成立;否则,断言没有发现样本数据与相矛盾的证据。4.二个概念(1).分类变量对于性别变量,取值为:男、女这种变量的不同取“值”表示个体所属的不同类别,这类变量称为分类变量。分类变量在现实生活中是大量存在的,如是否
4、吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等等。(2)利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.(为假设检验的特例)问题:为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965在不吸烟者中患肺癌的比重是0.54%。在吸烟者中患肺癌的比重是2.28%说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大1)通过图形
5、直观判断两个分类变量是否相关:2)通过图形直观判断两个分类变量是否相关:3)通过图形直观判断两个分类变量是否相关:通过数据和图表分析,得到结论是:吸烟与串肺癌有关。5.独立性检验:吸烟和患肺癌之间没有关系结论的可靠程度如何?:吸烟和患肺癌之间有关系。将数据一般化,用下列表格表示为:吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d独立性检验用A表示“不吸烟”,B表示“不患肺癌”,则:吸烟和患肺癌之间没有关系等价于“吸烟”与“患肺癌”独立,即A与B独立。即6.2×2列联表引入一个随机变
6、量作为检验在多大程度上可以认为“两个变量有关系”的标准。设有两个分类变量X和Y它们的值域分别为{x1,x2}和{y1,y2}其样本频数列表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d7.8.的概率分布表。1)如果P(m>10.828)=0.001表示有99.9%的把握认为“X与Y”有关系;2)如果P(m>7.879)=0.005表示有99.5%的把握认为“X与Y”有关系;3)如果P(m>6.635)=0.01表示有99%的把握认为“X与Y”有关系;4)如果P(m>5.
7、024)=0.025表示有97.5%的把握认为“X与Y”有关系;5)如果P(m>3.841)=0.05表示有95%的把握认为“X与Y”有关系;6)如果P(m>2.706)=0.010表示有90%的把握认为“X与Y”有关系;7)如果m≤2.706),就认为没有充分的证据显示“X与Y”有关系;例1.为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)吸烟与肺癌列联表 不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965问题:患肺癌与吸烟是否有关?解:假设
8、:吸烟和患肺癌之间没有关系。则通过公式计算`已知在成立的情况下即在成立的情况下,大于6.635概率非常小,近似为0.01现在的=56.632的观测值远大于6.635。即假设成立的可能性的大小小于0.01。则假设不成立的可能性大于99%。即有99%的把握认为患肺癌和吸烟之间有关
此文档下载收益归作者所有