欢迎来到天天文库
浏览记录
ID:36208612
大小:1.04 MB
页数:74页
时间:2019-05-07
《[医学]卫统 卡方检验》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第七章卡方检验小组成员:彭渝轩冯丹杨芳卡方检验第一节四格表资料的χ2检验第二节配对四格表资料的χ2检验第三节四格表资料的Fisher确切概率法第四节行×列表资料的χ2检验第五节多个样本率间的多重比较第六节有序分组资料的线性趋势检验第七节频数分布拟合优度的χ2检验四格表资料的χ2检验卡方检验是(χ2检验,Chi-squaretest)是现代统计学的创始人之一,英国人K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,是分类计数资料的假设检验方法,可用于两个或多个率间或构成比之间的比较,计数资料
2、的关联度分析,拟合优度检验等等。这就是著名的pearsonχ2检验。卡方检验的检验统计量为:卡方检验是建立在卡方分布的基础上。2分布是一种连续型分布,只有自由度一个参数。按分布的密度函数可给出不同自由度的一簇分布曲线。2分布的形状依赖于自由度的大小:当自由度≤2时,曲线呈L形;随着自由度的增加,曲线逐渐趋于对称;当自由度趋向于无穷大时,2分布趋向正态分布。3.847.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)2分布具有可加性,如果两个独立的随机变量X1X2分别服从自由
3、度v1v2的2分布,那么它们的和(X1+X2)服从自由度(v1+v2)的2分布。自由度一定时,P值越小,2值越大。当P值一定时,自由度越大,2越大。2检验时,先计算检验统计量2值,然后按自由度查2界值表,确定P值。卡方检验的基本原理卡方检验的基本思想是检验列联表的实际频数和理论频数的差别是否由抽样误差所引起。x2反映了实际频数与理论频数的吻合程度,卡方检验就是通过二者的吻合程度大小作出统计推断。对于同一份资料,u2=x2组别骨质增生合计发生率发生未发生井下工人18224045%井上工人9273625%合计274
4、97635.5%表:两组工人的骨质增生发生率比较期望频数的分布根据前面的表格,假设两总体发生率相等,均等于合计的骨质增生发生率35.5%(27/76),根据上述假设,计算表格中对应的期望频数,也可称为理论数,记作T。根据上述假设,计算得到井下矿工组发生骨质增生的期望频数T11=40×(27/76)=14.2,井上工人组发生骨质增生的期望频数T21=36×(27/76)=12.8组别骨质增生合计发生率发生未发生井下工人18(14.2)22(25.8)4045井上工人9(12.8)27(23.2)3625合计27497635.5
5、表:两组工人的骨质增生发生率比较综合以上思路,列联表期望频数的统一计算公式为:如果H0成立,A与T不应相差太大,x2值不应很大;如果H0不成立,由H0为真的条件下所计算的理论频数与样本的实际频数的差别会很大,大多数情况下的检验统计量x2会较大或很大。理论上可以证明,若H0成立,服从x2分布。A:表示实际频数,即实际观察到的例数。T:理论频数,期望频数,即如果假设检验成立,应该观察到的例数。计算出x2值后,查表判断如此大的x2是否为小概率事件,以判断建设检验是否成立。如果x2值大于临界值,P6、除了与(A-T)的差值有关外,还取决于格子数(严格说是自由度)的多少。因为每个格子的(A-T)2/T都是正值,因此格子数越多,x2值就越大。所以考虑x2值大小的意义时就要同时考虑自由度自由度:=(R-1)×(C-1),其中,R行数,C列数例题:为了解井下矿工腰脊椎退行性变化情况,2002年某医生从某煤矿井下作业15-20年的40岁以上矿工的名单中按系统抽样的方法随机抽取40名工人为观察组;同时从年龄、工龄和身高相近的井上体力劳动者中按同样方法随机抽取36名工人作为对照组。对每个观察单位做X光影像检查,并根据检查结果将76名7、调查对象分为骨质增生发生和未发生两种情况。用卡方检验来回答井下矿工与井上工人的骨质增生发生率有无不同。例题组别骨质增生合计发生率发生未发生井下工人18(14.2)22(25.8)4045井上工人9(12.8)27(23.2)3625合计27497635.5表:两组工人的骨质增生发生率比较具体步骤1.建立假设2.计算卡方统计量3、确定P值,并做出结论卡方检验的使用范围两组及多组率的检验两组及多组构成比分布的检验独立性检验拟合优度检验四格表资料的x2检验什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料,即2×2列联表8、。四格表的一般形式假设一组和二组的总体阳性率相等,均等于即因此,以两样本组的合计阳性率作为理论频率。期望频数就可以通过每组的合计数与总体阳性率乘积得到,也即四格表资料的一般公式A是实际频数,T是根据假设检验来确定的,是当H0成立时,计算出的理论频数。四格表资料的一般公式展开式四格表资料的专
6、除了与(A-T)的差值有关外,还取决于格子数(严格说是自由度)的多少。因为每个格子的(A-T)2/T都是正值,因此格子数越多,x2值就越大。所以考虑x2值大小的意义时就要同时考虑自由度自由度:=(R-1)×(C-1),其中,R行数,C列数例题:为了解井下矿工腰脊椎退行性变化情况,2002年某医生从某煤矿井下作业15-20年的40岁以上矿工的名单中按系统抽样的方法随机抽取40名工人为观察组;同时从年龄、工龄和身高相近的井上体力劳动者中按同样方法随机抽取36名工人作为对照组。对每个观察单位做X光影像检查,并根据检查结果将76名
7、调查对象分为骨质增生发生和未发生两种情况。用卡方检验来回答井下矿工与井上工人的骨质增生发生率有无不同。例题组别骨质增生合计发生率发生未发生井下工人18(14.2)22(25.8)4045井上工人9(12.8)27(23.2)3625合计27497635.5表:两组工人的骨质增生发生率比较具体步骤1.建立假设2.计算卡方统计量3、确定P值,并做出结论卡方检验的使用范围两组及多组率的检验两组及多组构成比分布的检验独立性检验拟合优度检验四格表资料的x2检验什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料,即2×2列联表
8、。四格表的一般形式假设一组和二组的总体阳性率相等,均等于即因此,以两样本组的合计阳性率作为理论频率。期望频数就可以通过每组的合计数与总体阳性率乘积得到,也即四格表资料的一般公式A是实际频数,T是根据假设检验来确定的,是当H0成立时,计算出的理论频数。四格表资料的一般公式展开式四格表资料的专
此文档下载收益归作者所有