第九章 卡方检验1

第九章 卡方检验1

ID:20296518

大小:810.50 KB

页数:54页

时间:2018-10-12

第九章 卡方检验1_第1页
第九章 卡方检验1_第2页
第九章 卡方检验1_第3页
第九章 卡方检验1_第4页
第九章 卡方检验1_第5页
资源描述:

《第九章 卡方检验1》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、检验第九章目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率比较的分割两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:应用:计数资料(1)分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线(图6-10)。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度ν1和ν2的分布,即,那么它们的和(X1+X2)服从自由度(ν1+ν2)的分布,即~。附表8给出了自由度取不同值时,分布单侧尾部面积的界值,它满足条件根据的定义,当自由度时,

2、分布的界值为标准正态分布界值的平方。第一节2×2表检验目的:推断两个总体率(构成比)是否有差别(和u检验等价)要求:两样本的两分类个体数排列成四格表资料一、两独立样本率检验 (一)两独立样本率资料的四格表形式例9-1为研究肿瘤标志物癌胚抗原(CEA)对肺癌的诊断价值,随机抽取72例确诊为肺癌的患者为肺癌组,114例接受健康体检的非肺癌患者为对照组。用CEA对其进行检测,结果呈阳性反应者病例组中33例,对照组中10例。问两组人群的CEA阳性率有无差异?表9-1CEA对两组人群的诊断结果**括号内为理论频数。本例资料经整理成表9-1

3、形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有33、39、10、104四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。(二)检验的基本思想表9-2四格表资料的基本形式基本思想:可通过检验的基本公式来理解。式中,A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency)。理论频数是根据检验设,且用合并率来估计而定的。理论频数由下式求得:式中,TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计检验统计量值反映了实际频数与理论频数的

4、吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。由公式(9-1)还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量

5、n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。(1)建立检验假设,确定检验水平。H0:π1=π2H1:π1≠π2α=0.05。(三)假设检验(2)求检验统计量值四格表资料检验的专用公式(四)四格表资料检验的校正公式分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性,则进行连续性校正。四格表资料检验公式选择条件:,不校正的理论或专用公式;,校正公式;,直接计算概率。连续性校正仅用于的四格表资料,当时,一般不作校正。例

6、9-2将116例癫痫患者随机分为两组,一组70例接受常规加高压氧治疗(高压氧组),另一组46例接受常规治疗(常规组),治疗结果见表7-4。问两种疗法的有效率有无差别?表9-3两种疗法治疗癫痫的效果本例,故用四格表资料检验的校正公式,查界值表得。按检验水准不拒绝,尚不能认为组有效率不等。本资料若不校正时,结论与之相反。二、两相关样本率检验(McNemar检验)配对四格表资料的检验与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料

7、。例9-3某抗癌新药的毒理研究中,将78只大鼠按性别、窝别、体重、年龄等因素配成39对,每个对子的两只大鼠经随机分配,分别接受甲剂量和乙剂量注射,试验结果见表9-4。试分析该新药两种不同剂量的毒性有无差异。表9-4某抗癌新药两种剂量的毒理实验结果上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①两只大鼠均死亡(甲+乙+)数(a);②两只均生存(甲-乙-)数(d);③其中一只死亡(甲+乙-)数(b);④其中一只死亡(甲-乙+)数(c)。其中,a,d为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情

8、况。检验统计量为注意:本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。