欢迎来到天天文库
浏览记录
ID:50604377
大小:613.50 KB
页数:23页
时间:2020-03-12
《高中数学1-2独立性检验的基本思想及其初步应用课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、独立性检验的基本思想及其初步应用问题:数学家庞加莱每天都从一家面包店买一块1000g的面包,并记录下买回的面包的实际质量。一年后,这位数学家发现,所记录数据的均值为950g。于是庞加莱推断这家面包店的面包分量不足。假设“面包分量足”,则一年购买面包的质量数据的平均值应该不少于1000g;“这个平均值不大于950g”是一个与假设“面包分量足”矛盾的小概率事件;这个小概率事件的发生使庞加莱得出推断结果。一:假设检验问题的原理假设检验问题由两个互斥的假设构成,其中一个叫做原假设,用H0表示;另一个叫做备择假设,用H1表示。例如,在前面的
2、例子中,原假设为:H0:面包分量足,备择假设为H1:面包分量不足。这个假设检验问题可以表达为:H0:面包分量足←→H1:面包分量不足二:求解假设检验问题考虑假设检验问题:H0:面包分量足←→H1:面包分量不足在H0成立的条件下,构造与H0矛盾的小概率事件;如果样本使得这个小概率事件发生,就能以一定把握断言H1成立;否则,断言没有发现样本数据与H0相矛盾的证据。求解思路:1、介绍两个相关的概念对于性别变量,其取值为男和女两种,这种变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量,也称为属性变量或定性变量,它们的取值一
3、定是离散的,而且不同的取值仅表示个体所属的类别。(1)分类变量:定量变量的取值一定是实数,它们的取值大小有特定的含义,不同取值之间的运算也有特定的含义。(2)定量变量:例如身高、体重、考试成绩等,张明的身高是180cm,李立的身高是175cm,说明张明比李立高180-175=5(cm)。独立性检验本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心分类变量的之间是否有关系不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了
4、9965人,得到如下结果(单位:人):那么吸烟是否对患肺癌有影响?表1-9吸烟与患肺癌列联表1、象这样的两个分类变量的频数表叫列联表.在不吸烟者中,有0.54%患有肺癌;在吸烟者中,有2.28%患有肺癌。因此,直观上可以得到结论:吸烟者和不吸烟者患肺癌的可能性存在差异。2、与表格相比,三维柱形图和二维条形图能更直观地反映出相关数据的总体状况。三维柱形图二维条形图不患肺癌患肺癌吸烟不吸烟不患肺癌患肺癌吸烟不吸烟080007000600050004000300020001000不吸烟吸烟患肺癌比例不患肺癌比例等高条形图上面我们通过分析
5、数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?你得到这个结论有多大的把握呢?独立性检验H0:吸烟和患肺癌之间没有关系←→H1:吸烟和患肺癌之间有关系通过数据和图表分析,得到结论是:吸烟与患肺癌有关结论的可靠程度如何?用A表示“不吸烟”,B表示“不患肺癌”则H0:吸烟和患肺癌之间没有关系“吸烟”与“患肺癌”独立,即A与B独立等价于等价于吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d独立性检验引入一个随机变量作为检验在多大程度上可以认为“两个变量有关系”的标准。因
6、此:若H0成立,则K2应很小。利用公式(1)计算得到K2的观测值为如何看待这个值呢?即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01。而现在K2的值56.632远大于6.635,故它是小概率事件,所以我们认为H0是不成立的.虽然这种判断犯错误的可能性存在,但我们有99%的把握认为H0是不成立的!(即吸烟与患肺癌有关系)在H0成立的情况下,统计学家研究出如下的概率上面这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。独立性检验的定义:独立性检验基本的思想类
7、似反证法(1)假设结论不成立,即“两个分类变量没有关系”.(2)在此假设下随机变量K2应该很能小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理.(3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度约为99.9%.独立性检验的基本思想:要确认“两个分类变量有关系”这一结论成立的可信程度,首先,假设该结论不成立,即假设结论“两个分类变量没有关系”成立。其次,在假设下,计算构造的随机变量K2,如果有观测数据计算
8、得到的K2≥k0,则我们有[1-P(K2≥k0)]*100%把握说明假设不合理(即两个分类变量有关系)。当K2≤k0,则我们没有[1-P(K2≥k0)]*100%把握说明假设不合理。设要判断的结论为:H1:“X与Y有关系”1、通过三维柱形图和二维条
此文档下载收益归作者所有