资源描述:
《高中数学第三章统计案例2独立性检验导学案北师大版选修2-3》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、§2独立性检验自主整理1.设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=1;变量B:B1,B2=1.通过观察得到下表所示数据:ABB1B2总计A1aA2总计其中,a表示变量A取A1,且变量B取B1时的数据;b表示变量A取A1,且变量B取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据.设n=a+b+c+d,用_______________估计P(A1B1),______________估计P(A1),__________估计P(B1).若有式子
2、,则可以认为______________独立.同理,若,则可以认为______________独立;若,则可以认为______________独立;若,则可以认为______________独立.但是,在中,由于表示的是______________,不同于概率,即使变量之间独立,式子两边也不一定恰好相等.但是当两边相差______________时,变量之间就不独立.2.选取χ2作统计量,用它的大小来检验变量之间是否独立.χ2=____________________________________________
3、__________________________当数据量较大时,在统计中,用以下结果对变量的独立性进行判断.(1)当χ2≤______________时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ2>______________时,有90%的把握判定变量A,B有关联;(3)当χ2>______________时,有95%的把握判定变量A,B有关联;(4)当χ2>______________时,有99%的把握判定变量A,B有关联.高手笔记1.独立性检验的基本思想先假设两个分类变
4、量X与Y无关系,即X与Y相互独立,计算χ2的观测值k,把k与临界值进行比较,可以判断X与Y有关系的程度及无关系.在该假设下,构造的随机变量χ2应该很小,如果实际计算出的χ2的观测值很大,则在一定程度上说明假设不合理,根据χ24的含义可以利用统计估算出概率P(χ2≥6.635)≈0.01,即有1%的把握认为X与Y无关,也就是说有99%的把握认为X与Y有关联.2.独立性检验的一般步骤(1)假设两个分类变量X与Y无关联;(2)计算出χ2=(3)把χ2的值与临界值比较确定X与Y有关联的程度或无关联.名师解惑从教科书中,我们
5、得到“有99%以上的把握认为吸烟与患肺癌是有关的”这一结论,有的同学认为这一结论应该这样理解:即100个抽烟的人中,有99个患有肺癌.请问这样理解是否正确?剖析:不正确.首先要区别“事件发生的概率”与“独立性检验中X与Y有关联的概率”.(1)事件发生的概率.例如袋中有100个球,其中99个白球,1个黑球,随机取一个球,则取到白球的概率为99%.(2)两个变量X与Y有关系的概率.例如教科书中吸烟与患肺癌之间有关系的概率为99%,并非指吸烟者中有99%的人患肺癌,而是指我们有99%的把握认为“吸烟与患肺癌有关系”,(而
6、在吸烟者中,只有2.82%的人患肺癌)我们得到的结论是:吸烟者与不吸烟者患肺癌的可能性存在差异,这里所说的“吸烟与患肺癌有关系”是指统计上的关系,而非因果关系,至于吸烟者患不患肺癌,应该由医学检查来确定,而非统计学上的事了.讲练互动【例1】在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,利用独立性检验的方法判断秃顶与患心脏病是否有关系.分析:计算χ2的值,然后与临界值进行比较.解:根据题目所给的数据得到如下列联表:患心脏病患其他病总计
7、秃顶214175389不秃顶4515971048总计6657721437故χ2=≈16.373>6.635,所以有99%的把握认为“秃顶与患心脏病有关”.黑色陷阱:因为这组数据来自住院的病人,因此所得到的结论只适合住院的病人群体,不要脱离这个前提而将结论推广到一般人群..变式训练1.为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学课程总计男3785122女35143178总计722283004由表中的数据,你认为在多大程度上可以认为高
8、中生的性别与是否喜欢数学课程之间有关系?为什么?解:χ2=≈4.513>3.841,在假设“性别与是否喜欢数学课程之间没有关系”的前提下,χ2应该很小,并且P(χ2>3.841)≈0.05,而我们所得到的χ2的观察值4.513超过3.841,这就意味着“性别与是否喜欢数学课程之间有关系”这一结论是错误的可能性约为0.05,即有95%的把握认为“性别与是否喜欢