分类数据的统计分析

分类数据的统计分析

ID:5278466

大小:684.27 KB

页数:113页

时间:2017-12-07

分类数据的统计分析_第1页
分类数据的统计分析_第2页
分类数据的统计分析_第3页
分类数据的统计分析_第4页
分类数据的统计分析_第5页
资源描述:

《分类数据的统计分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、分类数据的统计分析开设目的¢医学科研中分类数据多见¢常用的分类数据的统计分析方法¢软件实现过程讲授内容¢列联表中变量关联(association)的假设检验≠2×2表≠行×列表≠分层2×2表≠CMH方法¢解释变量与反应结果间联系的统计模型≠LOGISTIC回归模型≠Poisson回归模型≠对数线性模型成绩评定¢到课次数(20%)¢平时作业(30%)¢期终测验(50%)参考资料¢分类数据的统计分析及SAS编程¢CategoricalDataAnalysisUsingtheSASSystem¢SAS-BaseandSAS-STATUser'sGuide_Version8¢SPSS使

2、用教程分类数据定义分类数据是指反应变量(应变量)为分类变量,而解释变量(自变量)可是分类变量或连续变量。¢列联表中变量关联(association)的假设检验¢解释变量与反应结果间联系的统计模型。分类反应变量的尺度¢分类尺度:分类尺度是两种可能的结果¢顺序尺度:结果不止两种可能性,而且有顺序关系¢离散计数:结果本身是离散计数¢名义尺度:结果多于两类,而类别之间并没有顺序关系¢分组计数:数据本身是连续数据,经分组后,反应变量为在不同组中的例数。分类数据分析策略¾假设检验对建立的一个关于联系(association)的假设进行检验,说明列联表的行与列之间是否有关。¾建立模型用建立模

3、型的方法可求得各参数值,说明各因素的作用。通常用最大似然估计或加权最小二乘法估计。列联表一般,若总体中的个体可按两个属性A与B分类,A有r个等级A,A,…,A,B有c个等级B,B,…,12r12B,从总体中抽取大小为n的样本,设其中有n个个cij体的属性属于等级A和B,n称为频数,将r×c个nijijij排列为一个r行c列的二维列联表(contingencytable),简称r×c表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维(分层)列联表。若每次只分析两个定性变量时,可将资料整理为2×2表、2×C表或R×C表的形式。列联表列联表分析的基本问题是,判明所考察的

4、各变量之间有无关联,即是否独立。列联表分析的统计分析方法很多,所以在实际应用中,可根据下列几方面正确的选用分析方法:°定性变量个数°定性变量的属性(名义变量还是有序变量)、°频数(总频数和各网格上的理论频数)°资料的收集方式(研究设计)。°分析目的2×2列联表资料例题例1在研究老年慢性支气管炎的中草药疗效时,将病人随机分配到江剪刀草组和服麻片组。结果疗效如下表所示,试作统计分析。组别无效有效合计江剪刀草26370333胆麻片180102282合计443172615Pearson2χ检验RC()AT−22ijijχνP==∑∑(RC−1)(−1)ij==11Tij基本公式由Kar

5、lPearson(1900)提出,因此软件上常称这种检验为Pearsonχ2检验2×2列联表Pearsonχ2检验四格表22()AT−2列变量2ijij行变量合计χ=∑∑有无Pij==11Tij组1nnn11121+组2nnn121222+ν=合计nnn+1+2nnij++T=ijn四格表专用公式四格表可由基本公式推导出,直列变量接由各格子的实际频数(行变量合计有无a、b、c、d)计算可得四a+b组1ab格表专用公式:组2cdc+d22()AT−合计a+cb+dn基本公式:χ=∑T2222⎡⎤()abac++()⎡⎤()abbd++()⎡⎤()accd++()⎡⎤()cdbd+

6、+()abcd−−−−⎢⎥⎣⎦abcd+++⎢⎥⎣⎦abcd+++⎢⎥⎣⎦abcd+++⎢⎥⎣⎦abcd+++=+++()abac++()()abbd++()()accd++()()cdbd++()abcd+++abcd+++abcd+++abcd+++2()adbc−⋅n=ν=1;()abcdacbd++++()()()连续性校正χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correctionforcontinuity),又称Yates校正(Yates'correction,1934)。⑴当n≥40,而1≤T<5时,用连续性校正公式⑵当n<

7、40或T<1时,用Fisher精确检验(Fisherexacttest)校正公式:2(0AT−−.5)2χ=×∑,(也适合其它行列表资料)cT2(ad−bc−n/2)n2χ=c(a+b)(c+d)(a+c)(b+d)2×2列联表Mantel-Haenszelχ2(1959)Mantel-Haenszel2χ结果处理(calledtheMantel-Haenszel12合计testforlinearassociationor1nnn11121+linearbylinearassociation

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。