卫生统计学二5 无序分类资料的统计分析.pdf

卫生统计学二5 无序分类资料的统计分析.pdf

ID:58313216

大小:2.67 MB

页数:49页

时间:2020-09-04

卫生统计学二5 无序分类资料的统计分析.pdf_第1页
卫生统计学二5 无序分类资料的统计分析.pdf_第2页
卫生统计学二5 无序分类资料的统计分析.pdf_第3页
卫生统计学二5 无序分类资料的统计分析.pdf_第4页
卫生统计学二5 无序分类资料的统计分析.pdf_第5页
资源描述:

《卫生统计学二5 无序分类资料的统计分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、无序分类资料的统计分析内容1四格表和卡方检验原理2成组设计两样本率比较的卡方检验3确切概率法4行列表卡方检验入门例子拟合优度检验v有时并不知道样本所代表的总体呈何分布v拟合优度检验goodness-of-fittestv对总体分布进行推断v不针对参数,而是针对分布的类型v推断单样本的k组频数的分布与某一理论分布是否相同的一种假设检验方法假设检验vH0:该山区人群和这个地区人群的血型分布是一致的vH1:该山区人群和这个地区人群的血型分布不一致vPearson’s卡方检验k22()ATii−χP=∑i=1TivA:实际頻

2、数(actualfrequency)vT:理论頻数(theoreticalfrequency)Chi-squareddistribution四格表表6.2使用含氟牙膏与一般牙膏儿童的龋患率牙膏类型患龋齿人数未患龋齿人数调查人数龋患率(%)含氟牙膏70(76.67)130(123.33)20035.00一般牙膏45(38.33)55(61.67)10045.00合计11518530038.33更一般地,可将上述表格记为表6.3的一般形式,称之为四格表(fourfoldtable)。因为表中a、b、c和d四个格子的数据是

3、基本的,其余数据均可从这四个数据派生出来。概述v卡方检验是以卡方分布为基础的一种常用假设检验方法,主要用于分类变量,它基本的无效假设是(不包括配对资料):§H0:行分类变量与列分类变量无关联§H1:行分类变量与列分类变量有关联§α=0.05k()AT−22iiχP=∑§统计量i=1Ti,其中Ai是样本资料的计数,Ti是在H0为真的情况下的理论数(期望值)。卡方检验§在H0为真时,实际观察数与理论数之差Ai-Ti应该比较接近0。所以在H0为真时,检验统计量k22()ATii−χP=∑服从自由度为k-1的卡方分布。i=1

4、Ti22即:χχ>,拒绝H0。Pvα,上述卡方检验由此派生了不同应用背景的各种问题的检验,特别最常用的是两个样本率的检验等。方法原理v理论频数§基于H0成立,两样本所在总体无差别的前提下nn计算出各单元格的理论频数来T=RCRCn牙膏类型患龋齿人数未患龋齿人数调查人数龋患率(%)含氟牙膏70(76.67)130(123.33)20035.00一般牙膏45(38.33)55(61.67)10045.00合计11518530038.33方法原理v残差§设A代表某个类别的观察频数,E代表基于H0计算出的期望频数,A与E之差

5、被称为残差。§残差可以表示某一个类别观察值和理论值的偏离程度,但残差有正有负,相加后会彼此抵消,总和仍然为0。为此可以将残差平方后求和,以表示样本总的偏离无效假设的程度。方法原理另一方面,残差大小是一个相对的概念,相对于期望频数为10时,20的残差非常大;可相对于期望频数为1000时20就很小了。因此又将残差平方除以期望频数再求和,以标准化观察频数与期望频数的差别。§这就是我们所说的卡方统计量,在1900年由英国统计学家Pearson首次提出,其公式为:kk222()()AEii−−Aniipχ==∑∑ii==11E

6、niip方法原理•从卡方的计算公式可见,当观察频数与期望频数完全一致时,卡方值为0;•观察频数与期望频数越接近,两者之间的差异越小,卡方值越小;•反之,观察频数与期望频数差别越大,两者之间的差异越大,卡方值越大。•当然,卡方值的大小也和自由度有关。方法原理v卡方分布§显然,卡方值的大小不仅与A、E之差有关,还与单元格数(自由度)有关0.30.20.10.00246810操作步骤1.建立检验假设和确定检验水准§H0:使用含氟牙膏和一般牙膏儿童龋患率相等§H1:使用含氟牙膏和一般牙膏儿童龋患率不等2.α=0.053.计算

7、检验统计量χ2值()2()2()2()2270−76.67130−123.3345−38.3355−61.67χ=+++76.67123.3338.3361.67=2.82操作步骤4.确定P值和作出推断结论§查附表8,χ2界值表,得p>0.05。按α=0.05水准,不拒绝H0,尚不能认为使用含氟牙膏比使用一般牙膏儿童的龋患率低。§对于四格表,卡方的计算公式又可进行简化,以方便手工计算卡方检验假设的等价性v两组儿童的龋齿率相同§两组发生率的比较v使用不同的牙膏并不会影响龋齿的发生(两个分类变量间无关联)§两变量的相关分

8、析四格表资料χ2检验的校正χ2分布是一种连续性分布,而分类变量资料属离散性分布,由此得到的统计量也是不连续的。为改善χ2统计量分布的连续性,英国统计学家YatesFisher建议将实际频数和理论频数之差的绝对值减去校正公式:0.5以作校正。2(AT−−0.5)2χ=∑T2(/adbc−−n2)n2χ=()abcdacbd++++()()()19

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。