分类资料的统计推断

分类资料的统计推断

ID:41589129

大小:947.51 KB

页数:32页

时间:2019-08-28

分类资料的统计推断_第1页
分类资料的统计推断_第2页
分类资料的统计推断_第3页
分类资料的统计推断_第4页
分类资料的统计推断_第5页
资源描述:

《分类资料的统计推断》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、分类资料的统计推断复习率的抽样误差与可信区间8.1样本率与总体率比较的u检验8.2两个样本率的比较(卡方检验)一、卡方检验的基本思想二、四格表专用公式三、连续性校正公式四、u检验五、Fisher’sexactprobability8.3多组率或构成比的比较8.4配对设计的比较复习率的抽样误差与可信区间一、率的抽样误差与标准误二、总体率的可信区间一、率的抽样误差与标准误由于抽样造成样本率(p)和总体率(π)的差异称为率的抽样误差(samplingerror),用率的标准误(standarderrorofrate)度量。如果总

2、体率π未知,用样本率p估计二、总体率的可信区间总体率的可信区间(confidenceinterval,CI):根据样本率推断总体率可能所在的范围。8.1样本率与总体率比较原理:当n较大,p与(1-p)均不接近于零时,如:p和n(1-p)均大于5,此时p的抽样分布接近正态分布,可考虑u检验。否则,应用二项分布原理直接计算概率法。样本率与总体率(一般为理论值、标准值或经大量观察所获得的稳定值等)比较的目的是推断该样本所代表的未知总体率与已知总体率是否相等。例8.1已知某地40岁以上成人高血压患病率为8%,为降低患病率,经健康教

3、育数年后,随机抽查2000人查出高血压患者100例,经健康教育后,该地高血压患病率是否有所下降?1.建立检验假设H0:π=π0=0.08。H1:π≠0.08,α=0.052.计算u值本例n=2000,X=100,p=0.05,π0=0.08,代入公式8.1,得:u=4.9453.确定P值u=4.945>2.58,故P<0.01,4.结论 按α=0.05的水准拒绝Ho,接受H1。故可以认为经健康教育后,该地高血压患病率有所下降。小结1.样本率也有抽样误差,率的抽样误差的大小用σp衡量,实际工作中用Sp来估计。2.二项分布当n

4、足够大,π和1-π均不太小,有nπ≥5和n(1-π)≥5时,近似正态分布。3.总体率的可信区间是用样本率估计总体率的可信区间。当p分布近似正态分布时,可用正态近似法估计率的可信区间。4.根据正态近似原理,可进行样本率与总体率以及两样本率比较的u检验。8.2两样本率的比较χ2检验(Chi-squaretest)是现代统计学的创始人之一,K.Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等。本章仅限于介绍两个和多个率/构成比比较的

5、χ2检验(Pearson’sChi-squaretest)。一、卡方检验的基本思想处理生存死亡合计生存率(%)用抗凝剂772310077.0(p1)不用抗凝剂594110059.0(p2)合计1366420068.0(pc)表8.1两种疗法治疗急性心梗病人生存率实际频数A(actualfrequency)理论频数T(theoreticalfrequency)四格表(fourfoldtable)各种情形下,理论与实际偏离的总和即为卡方值(chi-squarevalue),它反映了理论数与实际数的吻合情况,该统计量近似地服从自

6、由度为ν的卡方分布。χ2分布(chi-squaredistribution)χ2检验的基本公式上述基本公式由K.Pearson提出,因此许多统计软件上常称这种检验为Pearson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。二、四格表专用公式为了不计算理论频数T,可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式:例子查表,P189三、连续性校正公式χ2分布是一连续型分布,而四格表资料属离散型分布,对其进行校正称为连续性校正(

7、correctionforcontinuity),又称Yates校正(Yates'correction)。校正公式:四格表在n>40时出现有任一格1≤T<5时例子(结论相反)因为1<T<5,且n>40时,所以应用连续性校正χ2检验四、两个独立样本率比较的u检验表5-1两种疗法的心血管病病死率比较疗法死亡生存合计病死率(%)盐酸苯乙双胍26(X1)178204(n1)12.75(p1)安慰剂2(X2)6264(n2)3.13(p2)合计2824026810.45(pc)u检验的条件:n1p1和n1(1-p1)与n2p2和n2

8、(1-p2)均>5五、精确概率法(Fisher’sexactprobability)在无效假设成立的前提下并且周边合计固定时,产生任意四格表的概率为:P值为在无效假设成立的前提下,得到现有样本四格表以及更极端情况的四格表的概率。注意,四格表中值的特点:(1)各格相等,如表8.4的A-T,a、d、b、c四

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。