卡方检验硕PPT课件

卡方检验硕PPT课件

ID:82687797

大小:2.30 MB

页数:98页

时间:2022-11-05

上传者:胜利的果实
卡方检验硕PPT课件_第1页
卡方检验硕PPT课件_第2页
卡方检验硕PPT课件_第3页
卡方检验硕PPT课件_第4页
卡方检验硕PPT课件_第5页
卡方检验硕PPT课件_第6页
卡方检验硕PPT课件_第7页
卡方检验硕PPT课件_第8页
卡方检验硕PPT课件_第9页
卡方检验硕PPT课件_第10页
资源描述:

《卡方检验硕PPT课件》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1检验(Chi-squareTest)

12χ2检验(Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于资料分布的拟合优度检验、两个或多个率或构成比间的比较等等。

23

34

45

56

6目的:推断两个总体率或构成比之间有无差别多个总体率或构成比之间有无差别多个样本率的多重比较两个分类变量之间有无关联性频数分布拟合优度的检验。检验统计量:应用:计数资料

78第一节四格表资料的检验

89目的:推断两个总体率(构成比)是否有差别要求:两样本的两分类个体数排列成四格表资料

9101.基本思想例7-1某院欲比较异梨醇口服液(试验组)和氢氯噻嗪+地塞米松(对照组)降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表7-1。问两组降低颅内压的总体有效率有无差别?

1011表7-1两组降低颅内压有效率的比较

1112本例资料经整理成图7-2形式,即有两个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有四个基本数据,其余数据均由此四个数据推算出来的,故称四格表资料。

1213图7-2四格表资料的基本形式

1314基本思想:可通过检验的基本公式来理解。式中,A为实际频数(actualfrequency),T为理论频数(theoreticalfrequency)。式中,TRC为第R行C列的理论频数nR为相应的行合计nC为相应的列合计T为在无效假设前提下(两总体率相等,等于合计率)推算的预期值。

1415如上例,无效假设是试验组与对照组降低颅内压的总体有效率相等,均等于合计的有效率87%。那么在这个前提下,理论上,试验组的104例颅内压增高症患者中有效者应为104(174/200)=90.48,无效者为104(26/200)=13.52;同理,对照组的96例颅内压增高症患者中有效者应为96(174/200)=83.52,无效者为96(26/200)=12.48。

1516检验统计量值反映了实际频数与理论频数的吻合程度。若检验假设H0:π1=π2成立,四个格子的实际频数A与理论频数T相差不应该很大,即统计量不应该很大。如果值很大,即相对应的P值很小,若,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2。

1617由公式(7-1)还可以看出:值的大小还取决于个数的多少(严格地说是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也会愈大;所以只有考虑了自由度ν的影响,值才能正确地反映实际频数A和理论频数T的吻合程度。检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,v=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。

1718(1)分布是一种连续型分布:按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线(图7-1)。(2)分布的一个基本性质是可加性:如果两个独立的随机变量X1和X2分别服从自由度ν1和ν2的分布,即,那么它们的和(X1+X2)服从自由度(ν1+ν2)的分布,即~。2.分布

1819(3)界值:当v确定后,分布曲线下右侧尾部的面积为a时,横轴上相应的值,记作(见附表8)。值愈大,p值愈小;反之,值愈小,p值愈大。

1920

2021(1)建立检验假设,确定检验水平。H0:π1=π2即试验组与对照组降低颅内压的总体有效率相等H1:π1≠π2即试验组与对照组降低颅内压的总体有效率不相等α=0.053.假设检验步骤

2122(2)求检验统计量值

2223以v=1查附表8的界值表得P<0.005。按a=0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。

2324二、四格表资料检验的专用公式

2425分布是一连续型分布,而四格表资料属离散型分布,由此计算得的统计量的抽样分布亦呈离散性质。为改善统计量分布的连续性,则需行连续性校正。

2526三、四格表资料检验的校正公式

2627四格表资料检验公式选择条件:,专用公式;,校正公式;,直接计算概率。

2728例7-2某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将78例脑血管疾病患者随机分为两组,结果见表7-2。问两种药物治疗脑血管疾病的有效率是否相等?

2829表7-2两种药物治疗脑血管疾病有效率的比较

2930本例,故用四格表资料检验的校正公式v=1,查界值表得0.05

3031本资料若不校正时,结论与之相反。

3132第二节配对四格表资料的检验

3233与计量资料推断两总体均数是否有差别有成组设计和配对设计一样,计数资料推断两个总体率(构成比)是否有差别也有成组设计和配对设计,即四格表资料和配对四格表资料。

3334例7-3某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统红斑狼疮患者血清中抗核抗体进行测定,结果见表7-3。问两种方法的检测结果有无差别?

3435表7-3两种方法的检测结果

3536上述配对设计实验中,就每个对子而言,两种处理的结果不外乎有四种可能:①两种检测方法皆为阳性数(a);②两种检测方法皆为阴性数(d);③免疫荧光法为阳性,乳胶凝集法为阴性数(b);④乳胶凝集法为阳性,免疫荧光法为阴性数(c)。

3637其中,a,d为两法观察结果一致的两种情况,b,c为两法观察结果不一致的两种情况。检验统计量为

3738注意:本法一般用于样本含量不太大的资料。因为它仅考虑了两法结果不一致的两种情况(b,c),而未考虑样本含量n和两法结果一致的两种情况(a,d)。所以,当n很大且a与d的数值很大(即两法的一致率较高),b与c的数值相对较小时,即便是检验结果有统计学意义,其实际意义往往也不大。

3839检验步骤:,用校正公式v=1,查界值表得0.01

3940第三节四格表资料的Fisher确切概率法

4041条件:n<40,或T<1,或P≈a时,理论依据:超几何分布(非检验的范畴)

4142例7-4某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果,将33例HBsAg阳性孕妇随机分为预防注射组和非预防组,结果见表7-4。问两组新生儿的HBV总体感染率有无差别?

4243表7-4两组新生儿HBV感染率的比较

4344一、基本思想在四格表周边合计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率;再按检验假设用单侧或双侧的累计概率,依据所取的检验水准a做出推断。

44451.各组合概率Pi的计算在四格表周边合计数不变的条件下,表内4个实际频数a,b,c,d变动的组合数共有“周边合计中最小数+1”个。如例7-4,表内4个实际频数变动的组合数共有9+1=10个,依次为:

4546各组合的概率Pi服从超几何分布,其和为1。计算公式为

46472.累计概率的计算(单、双侧检验不同)设现有样本四格表中的交叉积差a*d*-b*c*=D*,其概率为P*,其余组合四格表的交叉积差记为Di,概率记为Pi。

4748(1)单侧检验若现有样本四格表中D*>0,须计算满足Di≥D*和Pi≤P*条件的各种组合下四格表的累计概率。若D*<0,则计算满足Di≤D*和Pi≤P*条件的各种组合下四格表的累计概率。

48THANKYOUSUCCESS2022/10/1949可编辑

4950(2)双侧检验计算满足和Pi≤P*条件的各种组合下四格表的累计概率。若遇到a+b=c+d或a+c=b+d时,四格表内各种组合的序列呈对称分布,此时按单侧检验规定条件只计算单侧累计概率,然后乘以2即得双侧累计概率。

5051二、检验步骤(本例n=33<40)1.计算现有样本四格表的D*和P*及各组合下四格表的Di,见表7-5。本例D*=-66,P*=0.08762728。2.计算满足条件的各组合下四格表的概率Pi。

51523.计算同时满足和Pi≤P*条件的四格表的累计概率。本例P1、P2、P3、P4、P5和P10满足条件,累计概率为P=P1+P2+P3+P4+P5+P10≈0.1210>0.05按a=0.05检验水准不拒绝H0,尚不能认为预防注射与非预防的新生儿HBV的感染率不等。

5253表7-5例7-4的Fisher确切概率法计算表

5354例7-5某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。问胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别?

5455表7-6胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较

5556本例a+b+c+d=10,由表7-7可看出,四格表内各种组合以i=4和i=5的组合为中心呈对称分布。表7-7例7-5的Fisher确切概率法计算表*为现有样本

5657(1)计算现有样本的D*和P*及各组合下四格表的Di。本例D*=50,P*=0.02708978。(2)计算满足Di≥50条件的各组合下四格表的概率Pi。(3)计算同时满足Di≥50和Pi≤P*条件的四格表的累计概率。本例为P7和P8,(4)计算双侧累计概率P。P>0.05,按α=0.05检验水准不拒绝H0,尚不能认为胆囊腺癌与胆囊腺瘤的P53基因表达阳性率不等。

5758注意:例7-5中,若专业上有理由认为胆囊腺癌不会低于胆囊腺瘤的P53基因表达阳性率,则进行单侧检验,H0:p1=p2,H1:p1≠p2,a=0.05,由表7-7计算单侧概率P=P7+P8≈0.0286,0.01

5859第四节行×列表资料的检验

5960行×列表资料①多个样本率比较时,有R行2列,称为R×2表;②两个样本的构成比比较时,有2行C列,称2×C表;③多个样本的构成比比较,以及双向无序分类资料关联性检验时,有行列,称为R×C表。

6061检验统计量

6162一、多个样本率的比较

6263例7-6某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效,资料见表7-8。问三种疗法的有效率有无差别?表7-8三种疗法有效率的比较

6364检验步骤:H0:p1=p2=p3,即三种疗法…有效率相等H1:三种疗法…有效率不全相等a=0.05查界值表得P<0.005。按a=0.05检验水准拒绝H0,接受H1,可以认为三种疗法治疗周围性面神经麻痹的有效率有差别。

6465二、样本构成比的比较

6566例7-7某医师在研究血管紧张素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?表7-9DN组与无DN组2型糖尿病患者ACE基因型分布的比较

6667检验步骤H0:两组总体构成比相同H1:两组总体构成比不同a=0.05查界值表得0.01

6768三、双向无序分类资料的关联性检验R×C表中两个分类变量皆为无序分类变量的行×列表资料,又称为双向无序R×C表资料。注意:双向无序分类资料为两个或多个样本,做差别检验(例7-7);若为单样本,做关联性检验。

6869例7-8测得某地5801人的ABO血型和MN血型结果如表7-10,问两种血型系统之间是否有关联?表7-10某地5801人的血型(单样本,做关联性检验)

6970表7-10资料,可用行×列表资料检验来推断两个分类变量之间有无关系(或关联);若有关系,可计算Pearson列联系数C进一步分析关系的密切程度:列联系数C取值范围在0~1之间。0表示完全独立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。

7071检验步骤H0:两种血型系统间无关联H1:两种血型系统间有关联a=0.05

7172由于列联系数C=0.1883,数值较小,故认为两种血型系统间虽然有关联性,但关系不太密切。查界值表得P<0.05。按a=0.05检验水准拒绝H0,接受H1,可认为两种血型系统间有关联,其Pearson列联系数为

7273四、行×列表资料检验的注意事项1.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种:(1)增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量,如同一批号试剂已用完等。

7374(2)根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。注意:不同年龄组可以合并,但不同血型就不能合并。(3)改用双向无序R×C表的Fisher确切概率法。

74752.多个样本率比较,若所得统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说明任两个总体率之间均有差别。要进一步推断哪两两总体率之间有差别,需进一步做多个样本率的多重比较(见第五节)。

75763.医学期刊中常见这样的情况:不管R×C表资料中的两个分类变量是有序还是无序,均用检验分析。这种做法是不妥的。对于有序的R×C表资料不宜用检验,因为行×列表资料的检验与分类变量的顺序无关,当有序变量的R×C表资料中的分类顺序固定不变时,无论将任何两行(或两列)频数互换,所得值皆不变,其结论相同,这显然是不妥的。因此在实际应用中,对于R×C表资料要根据其分类类型和研究目的选用恰当的检验方法(见第六节)。

7677第五节多个样本率间的多重比较

7778当多个样本率比较的R×2表资料检验,推断结论为拒绝H0,接受H1时,要进一步推断哪两两总体率有差别,若直接用四格表资料的检验进行多重比较,将会加大犯Ⅰ类错误的概率。样本率间的多重比较不能直接用四格表资料的检验。多个样本率间的多重比较的方法有分割法、Scheffe’可信区间法和SNK法。本节仅仅介绍一种基于分割法的多个样本率间多重比较的方法,后两种方法可参阅有关书籍。

7879因分析目的不同,k个样本率两两比较的次数不同,故重新规定的检验水准的估计方法亦不同。通常有两种情况:分割法一、基本思想多个样本率比较的资料可整理成2×k表资料,若经行×列表资料检验的结论为拒绝H0,接受H1时,可不经任何处理,直接用分割法把2×k表分成多个独立的四格表进行两两比较,但必须重新规定检验水准。其目的是为保证检验假设中I型错误a的概率不变。

79801.多个实验组间的两两比较分析目的为k个实验组间,任两个率均进行比较时,须进行次独立的四格表检验,再加上总的行×列表资料的检验,共次检验假设。故检验水准a用下式估计1.多个实验组间的两两比较分析目的为k个实验组间,任两个率均进行比较时,须进行次独立的四格表检验,再加上总的行×列表资料的检验,共次检验假设。故检验水准a用下式估计。式中,k为样本率的个数。

80812.实验组与同一个对照组的比较分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准a’用下式估计式中k为样本率的个数。由该式估计的检验水准a’较保守(a’通常较小)。

8182

8283二、多个实验组间的两两比较

8384例7-9对例7-6中表7-8的资料进行两两比较,以推断是否任两种疗法治疗周围性面神经麻痹的有效率均有差别?二、多个实验组间的两两比较

8485检验步骤本例为3个实验组间的两两比较H0:p1=p2,即任两对比组的总体有效率相等H1:p1≠p2,即任两对比组的总体有效率不等a=0.05

8586表7-12三种疗法有效率的两两比较

8687按a’=0.0125检验水准,物理疗法组与药物治疗组拒绝H0,接受H1;物理疗法组与外用膏药组拒绝H0,接受H1;药物治疗组与外用膏药组不拒绝H0;

8788例7-10以表7-8资料中的药物治疗组为对照组,物理疗法组与外用膏药组为试验组,试分析两试验组与对照组的总体有效率有无差别?H0:pT=pC,即各试验组与对照组的总体有效率相等H1:pT≠pC,即各试验组与对照组的总体有效率不等a=0.05本例为各实验组与同一对照组的比较三、各实验组与同一个对照组的比较

8889物理疗法组与药物治疗组比较:=6.76,P<0.0125外用膏药组与药物治疗组比较:=4.59,P>0.0125按a’=0.0125检验水准,物理疗法组与药物治疗组拒绝H0,接受H1,可认为物理疗法组与药物治疗组的总体有效率有差别;外用膏药组与药物治疗组不拒绝H0,尚不能认为两总体有效率有差别。结合表7-8资料,物理疗法的有效率高于药物治疗。

8990第七节频数分布拟合优度的检验

9091医学研究实践中,常需推断某现象频数分布是否符合某一理论分布。如正态性检验就是推断某资料是否符合正态分布的一种检验方法,但只适用于正态分布。Pearson值能反映实际频数和理论频数的吻合程度,故检验可用于推断频数分布的拟合优度,且应用广泛。如正态分布,二项分布,Poisson分布,负二项分布等。

9192例7-12观察某克山病区克山病患者的空间分布情况,调查者将该地区划分为279个取样单位,统计各取样单位历年累计病例数,资料见表7-15的第(1)、(2)栏,问此资料是否服从Poisson分布?

9293表7-15Poisson分布的拟合与检验*:X≥8的概率:1-0.9961=0.0039

9394本例n=279,,均数u=686/279=2.46,均数与方差相近,可试拟合Poisson分布。H0:本资料服从Poisson分布H1:本资料不服从Poisson分布a=0.10

9495按Poisson分布概率函数,,求得取样单位内病例数为0,1,2,……的概率P(X),理论频数TX=P(X)*n,列入表7-15的第(3)、(4)、(5)栏。因理论数T7=2.6,T8=1.1,皆小于5,故合并在T6。

9596以v=7-2=5(因T6,T7,T8合并后只有7行,计算Poisson分布的理论频数时用了均数与总例数n,故v=7-2),查界值表,得0.75

9697小结掌握(1)卡方检验的基本思想和用途;(2)成组设计四格表资料卡方检验的计算及应用条件;(3)配对设计四格表资料卡方检验;(4)行X列表资料卡方检验及应用时应注意的问题;熟悉行X列表资料卡方检验应用时应注意的问题。行X列表资料两两比较的卡方分割法。

97THANKYOUSUCCESS2022/10/1998可编辑

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭