资源描述:
《独立性检验的基本思想及其应用ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、独立性检验的基本思想及其初步应用1♂对于性别变量,其取值为男和女两种.♀这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.2生活中的分类变量是否吸烟,宗教信仰,国籍…两个分类变量之间是否有关系性别是否喜欢数学课程吸烟患肺癌3为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对肺癌有影响?吸烟与患肺癌列联表列出两个分类变量的频数表,称为列联表4不患肺癌患肺癌总计不吸烟7775427817吸烟
2、2099492148总计9874919965吸烟者与不吸烟者患肺癌的可能性存在差异56从上面数据和图形可以看出吸烟和患肺癌有关从上面数据和图形可以看出吸烟和患肺癌有关事实是否如此?我们能够有多大的把握认为“吸烟与患肺癌有关”?吸烟患肺癌7吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d假设H0:吸烟与患肺癌没有关系将表1-7中的数字用字母代替,得到如下用字母表示的列联表8ad-bc≈0
3、ad-bc
4、越小吸烟与患肺癌之间的关系越弱
5、ad-bc
6、越大吸烟与患肺癌之间的关系越强若H0成立9构造一个随机变量建
7、立统一标准(n=a+b+c+d)若H0成立K2应该很小根据前面数据K2的观察值10在“吸烟与患肺癌没有关系”成立的条件下可以估算出k≈56.6326.635远大于k>6.635,假设不合理程度约为99%99%的把握认为“吸烟与患肺癌有关系”但这种判断会犯错误,犯错误的概率不会超过0.0111在“吸烟与患肺癌没有关系”成立的条件下可以估算出k≈56.6326.635远大于利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.12确认“两个分类变量有关系”成立的可信程度假设该结论不成由观测数据计算K2的观测
8、值k通过概率评价该假设不合理的程度k>6.635,假设不合理程度约为99%13y1y2总计x1aba+bx1cdc+d总计a+cb+da+b+c+d假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表2×2列联表14若要推断的论述为H1:“X与Y有关系”可以按如下步骤判断结论H1成立的可能性1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度15162.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度.17要推断“X和Y有关系”,
9、可按下面的步骤进行:(1)提出假设H0:X和Y没有关系;(3)查对临界值,作出判断。(2)根据2×2列联表与公式计算的值;由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。182.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度.根据观测数据计算检验随机变量K2的观察值kP(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.
10、8415.0246.6357.87910.828当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度190.50.40.250.150.10.050.0250.010.0050.001xo0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828卡方临界值表:则有99.9%的把握认为“X与Y有关系”;(1)若观测值χ2>10.828.(3)若观测值χ2>2.706,则(4)若观测值χ2<2.706,则(2)若观测值χ2>6.635,则有99%的把握认为“X与Y有关系”;则有90%的把
11、握认为“X与Y有关系”;则没有充分的证据显示“X与Y有关系”,但也不能作出结论“H0成立”,即Ⅰ与Ⅱ没有关系。20例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?21患心脏病患其他病总计秃顶214175389不秃顶4515971048总计6657721437解根据数据得到如下列联表秃顶与患心脏病列联表22认为“秃顶与患心脏病有关”这组数据来自住院的病人,因此所得到的结论适合住院
12、的病人群体.23研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素引起的。在