第10章 χ2检验

第10章 χ2检验

ID:46202811

大小:1.78 MB

页数:71页

时间:2019-11-21

第10章 χ2检验_第1页
第10章 χ2检验_第2页
第10章 χ2检验_第3页
第10章 χ2检验_第4页
第10章 χ2检验_第5页
资源描述:

《第10章 χ2检验》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第10章χ2检验孔丹莉主要内容1、2×2表的χ2检验2、R×C表的χ2检验3、拟合优度的χ2检验4、线性趋势χ2检验5、Fishier确切概率法第一节2×2表的χ2检验2检验(Chi-squaretest)是现代统计学的创始人之一,英国统计学家K.Pearson于1900年提出的一种具有广泛用途的假设检验方法。常用于分类变量资料的统计推断,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。例10-1为比较西药与中药治疗慢性支气管炎的疗效,某医师将符合研究标准的110例慢性支气管炎患者随机分为两组(两组具有可比性),西药组

2、86例,中药组24例。服药一个疗程后,观察患者的疗效,结果见下表。根据显效率,该医师认为中西药治疗慢性支气管炎的疗效有差别中药组的疗效好于西药组。1.2检验的基本思想表10-1中西药治疗慢性支气管炎的显效率【问题10-1】(1)该资料为何种类型资料?(2)该研究属于何种设计方案?(3)该医师作出的结论是否正确?为什么?(4)该资料应该用何种统计方法?其步骤如何?----2×2表或四格表(fourfoldtable)表10-1中西药治疗慢性支气管炎的显效率表10-2中西药治疗慢性支气管炎的显效率2.四格表资料的卡方检验处理+-合计Aaba+

3、bBcdc+d合计a+cb+dn(a+b+c+d)四格表资料实际频数A(actualfrequency):a、b、c、d=(a+c)/(a+b+c+d)=53/110=48.18%理论频数T(theoreticalfrequency):表10-2中西药治疗慢性支气管炎的显效率H0:π1=π2=π,π(合计率)四格表资料处理+-合计AT11T12nRBT21T22nR合计nCnCn(a+b+c+d)理论频数计算公式西药组:理论显效人数T21=24×53/110=11.56理论非显效人数T22=24×57/110=12.44中药组:理论显效人数

4、T11=86×53/110=41.44理论非显效人数T12=86×57/110=44.56基本公式:--------反映了A和T吻合的程度;与格子数有关。H0:π1=π2=π,π----合计率自由度一定时,P值越小,x2值越大。当P值一定时,自由度越大,x2越大。=1时,P=0.05,x2=3.84(1.962)P=0.01,x2=6.63(2.582)P=0.05时,=1,x2=3.84=2,x2=5.99当自由度取1时,u2=x2χ2分布规律3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistrib

5、ution)χ2界值表2检验的自由度指可以自由取值的基本格子数自由度一定时,其2值的概率分布也就确定。根据自由度和检验水准查附表9(P344)可得2界值;若2值≥20.05(),则可按=0.05的检验水准拒绝H0;若2值<20.05(),则还不能拒绝H0。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。卡方检

6、验的基本原理例10-9某医生欲比较用甲、乙两种药物治疗动脉硬化的疗效,甲药治疗71例,有效52例,乙药治疗42例,有效39例,结果见表10-7。问两种药物的有效率是否有差别?表10-7甲、乙两种药物治疗动脉硬化的疗效比较H0:两药有效率相同,即1=2H1:两药有效率不同,即12=0.05(1)建立检验假设,确定检验水准20.025(1)=5.02,20.01(1)=6.63。本例5.02<2=6.48<6.63,所以,0.025P0.01,按=0.05水准,拒绝H0,接受H1,故认为甲、乙两药的疗效不同,乙药疗效要好

7、于甲药。(2)计算检验统计量和自由度(3)确定P值,做出推论n>40,Tmin>5χ2检验的基本公式上述基本公式由Pearson提出,因此软件上常称这种检验为Pearson卡方检验。下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。21四格表专用公式:本例,四格表专用公式为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:校正公式:四格表资料2检验的校正2分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的统计量也是不连续的

8、。为改善2统计量分布的连续性,英国统计学家YatesF建议将实际频数和理论频数之差的绝对值减去0.5以作校正。在实际工作中,对于四格表资料,通常规定(1)T≥5,且N≥40时,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。