计数资料的统计推断

计数资料的统计推断

ID:36811509

大小:541.81 KB

页数:38页

时间:2019-05-10

计数资料的统计推断_第1页
计数资料的统计推断_第2页
计数资料的统计推断_第3页
计数资料的统计推断_第4页
计数资料的统计推断_第5页
资源描述:

《计数资料的统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分类变量资料的统计推断熊伟第二节分类变量资料的统计推断一.率的抽样误差和标准误率的抽样误差:由于随机抽样造成的样本率和总体率之间以及各样本率之间存在的差异。率的抽样误差用率的标准误来表示:二.总体率的估计:一、点值估计:π=p二、区间估计:按照一定的概率(可信度)估计总体率(π)所在的范围(区间)。1、近似正态分布法:条件:np且n(1-p)均大于5,此时样本率p近似正态分布,可用正态分布曲线下的区间面积规律来估计π。公式:例1:某医院用复方当归注射液静脉滴注治疗脑动脉硬化症188例,其中显效83例,试估计复方当归注射液显效率的95%和99%的可信区间。n=188

2、,p=83/188=0.441595%CI为:99%CI为:2、查表法:n≤50,p或1-p接近于0或1,np或n(1-p)≮5时,可用查表法。例:从某校随机抽取26名学生,发现有4名感染沙眼,试求该校沙眼感染率的95%可信区间。本例n=26x=4,查附表得其95%CI为(0.04,0.35)。三.样本率与总体率比较的u检验:应用条件:样本含量足够大;样本率p或者1-p均不太小时,此时样本率的分布近似正态分布样本率与总体率的比较两样本率的比较:(一)样本率和总体率的比较例2:根据以往经验,一般胃溃疡患者有20%发生胃出血症状。现某医院观察65岁以上溃疡病人304例

3、,有31.6%发生胃出血症状,问老年胃溃疡患者是否较容易胃出血?:π=0.2:π>0.2单侧,拒绝,接受,差别有统计学意义。可认为老年人胃溃疡出血率较一般胃溃疡患者更易出血。(二)两个率的比较的u检验例3:某医院观察65岁以上溃疡病人100例,有20例发生胃出血症状,观察20-65岁的胃溃疡患者100例有12例发生胃出血症状。问老胃溃疡患者是否较中年患者容易胃出血?H0:π1=π2H1:π1≠π2α单=0.05本例:n1=100,x1=12,p1=0.12;n2=100,x2=20,p2=0.2合并率查u界值表,得P>0.05,按双侧α=0.05水平不拒绝H0,差

4、别无统计学意义,尚不能认为老年患者和中年患者的胃溃疡出血率有差别。第三节卡方检验χ2检验(Chi-squaretest),英国人K.Pearson(1857-1936)是现代统计学的创始人之一,于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较构成比的比较计数资料的关联度分析拟合优度检验等等。本章仅限于介绍两个和多个率或构成比比较的χ2检验。一、卡方检验的基本思想(1)疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)178(b)204(a+b)12.75(p1)安慰剂2(c)62(d)64(c+d)3.13(p2)合计28(a+c.)240

5、(b+d.)268(a+b+c+d=n)10.45(pc)例1两种疗法的心血管病病死率的比较2×2表或四格表(fourfoldtable)实际频数A(actualfrequency)(a、b、c、d)理论频数T(theoreticalfrequency)(H0:π1=π2=pc):a的理论频数=(a+b)×pc=(a+b)×[(a+c.)/n]=nRnC/n=21.3b的理论频数=(a+b)×(1-pc)=(a+b)×[(b+d.)/n]=nRnC/n=182.7c的理论频数=(c+d)×pc=(c+d)×[(a+c)/n]=nRnC/n=6.7d的理论频数=(c

6、+d)×(1-pc)=(c+d)×[(b+d.)/n]=nRnC/n=57.3疗法死亡生存合计盐酸苯乙双胍26(21.3)178(182.7)204安慰剂2(6.7)62(57.3)64合计28240268四格表资料的卡方检验的自由度为1卡方检验的自由度的计算公式:一、卡方检验的基本思想(2)各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它服从自由度为ν的卡方分布。卡方检验的基本思想:检验A与T之间的差异,如果A与T之间差异越大,则计算出来的χ2值就越大,查χ2界值表得出的P值就越小,如果小于了α=0.05,则拒绝H0假设。3.84

7、7.8112.59P=0.05的临界值χ2分布(chi-squaredistribution)χ2检验的基本公式上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。二、四格表专用公式(1)为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:二、四格表专用公式(2)2(1)~u2=2.19492=4.82(n>40,所有T5时)疗法死亡生存合计病死率(%)盐酸苯乙双胍26(a)

8、178(b

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。