资源描述:
《高中数学 第一章 统计案例 1_2_4 独立性检验的应用知识导航 北师大版选修1-21》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、2.4独立性检验的应用自主整理1.两个变量是否相关联,可通过对这一问题的调查数据,进行_______________.2.统计学选取统计量_______________的大小来检验变量之间是否独立.高手笔记1.变量的不同值表示个体所属的不同类别,这样的变量叫作分类变量,可以用列联表来表示.2.在统计中,用以下结果对变量的独立性进行判断:其中χ2=.(1)当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的.(2)当χ2>2.706时,有90%的把握判定变量A、B有关
2、联.(3)当χ2>3.841时,有95%的把握判定变量A、B有关联.(4)当χ2>6.635时,有99%的把握判定变量A、B有关联.3.一般地,假设两个分类变量A和B,它们的值域分别为{x1,x2},{y1,y2}.其样本频数列联表如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d可以利用独立性检验来计算出χ2的值来判断A与B的有关系的可能性大小,独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量A、B有关系,这个结论成立的可信程度,首先假设该结论不成立,即假设结论
3、“两个分类变量没有关系”成立.在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2很大,则在一定程度上说明假设不合理.根据随机变量χ2的含义,可以通过P(χ2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%.名师解惑为什么统计学中用χ2=的大小来检验变量之间是否独立呢?剖析:设A、B为两个变量,每个变量都可以取两个值.变量A:A1,A2=,变量B:B1,B2=.通过观察得到数
4、据为BAB1B2总计A1aba+bA2cdc+d总计A+cb+dn=a+b+c+d则P(A1B1)=,P(A1)=,P(B1)=.若=·,即P(A1B1)=P(A1)P(B1),则A1、B1相互独立.同理,若=·,则A1、B2相互独立.若=·,则A2、B1相互独立.若=·,则A2、B2相互独立.但是,,等表示的是频率,不同于概率.即使变量之间相互独立,式子两边也不一定恰好相等,但是当两边相差很大时,变量之间就不独立,即
5、·
6、很大时,变量之间不独立.同理,
7、·
8、,
9、·
10、,
11、·
12、很大时,变量之间也不独立.
13、可用χ2=n[+++]=的大小来检验变量之间是否独立.检验结果标准为:(1)当χ2≤2.706时,变量A、B没有关联.(2)当χ2>2.706时,有90%的把握判定变量A、B有关联.(3)当χ2>3.841时,有95%的把握判定变量A、B有关联.(4)当χ2>6.635时,有99%的把握判定变量A、B有关联.讲练互动【例1】对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计心脏搭桥手术39
14、157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.分析:从所给的列联表中可知病人有两种类型:做过心脏搭桥手术和做过血管清障手术,每种类型又有两种情况:又发作心脏病和未发作心脏病.问题是用表中所给出的数据来检验上述两种状态是否有关系,这是一个独立性检验问题,解决的方法是先计算随机变量χ2的观测值k,用k的大小来决定是否又发作心脏病与心脏搭桥手术有关还是无关.解:假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,
15、c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得χ2的观测值为χ2===1.78.因为χ2=1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.绿色通道本题可利用χ2=求出χ2的值,再利用临界值的大小关系来判断,解题时应注意准确代入数据进行计算.变式训练1.为了考察某种药物预防疾病的效果,进行动物实验,得到如下的列联表:患病未患病总计服用药104555没服用药203050总计3075105请问能有多大把握认为药物有效?解:
16、a=10,b=45,c=20,d=30,a+b=55,c+d=50,a+c=30,b+d=75,n=105,χ2===6.11,因为χ2=6.11>3.841,从而有95%的把握认为药物有效.【例2】甲、乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下列联表:优秀不优秀总计甲班103545乙班73845总计177390利用列联表的独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少?分析:求出χ2,然后查表求概率.解:假设成