资源描述:
《《非参数第九章》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第九章列联表§9.1二维列联表的齐性和独立性的检验例1(数据:wid.txt)对于某种疾病有三种处理方法.某医疗机构分别对22,15和19个病人用这三种方法处理,处理的结果分改善和没有改善两种,并且列在下表中:改善没有改善合计处理A101222处理B7815处理C61319合计233356问:不同处理的改善比例是不是一样例9.2(数据:shop.txt,shopA.txt)在一个有三个主要百货商场的商贸中心,调查者问479个不同年龄段的人首先去三个商场中的哪个,结果如下:年龄段商场1商场2商场3总和≤3083704519831-50
2、918615192>5041381089总和21519470479问:人们对这三个商场的选择和他们的年龄是否独立?以上两个例子的数据都有下面的两因子列联表形式:B1B2…Bc总和A1n11n12…n1cn1.Arnr1nr2…nrcnr.总和n.1n.2…n.cn..这里,行频数总和,列频数总和,而为行因子的个水平,为列因子的个水平.关于齐性的检验对于例9.1所代表的一类问题,要检验的是行分布的齐性(homogeneity).一般来说,对齐性的检验就是检验H0:“对所有行,(给定行的)条件列概率相同”.用数学语言,记(给定第i行后)
3、第j列条件概率为,零假设则为而备择假设为H1:“零假设中的等式至少有一个不成立”.对于例9.1关于不同处理下患者状况的改善情况的具体问题,零假设为:对于各种不同的处理,改善的比例(或概率)相同.在零假设下,第个格子的期望值应该等于,但未知,在零假设下,可以用其估计代替.这样期望值而观测值为,则Pearson统计量为在样本量较大时,近似地服从自由度为的分布>y=matrix(scan("E:/data/wid.txt"),3,2,b=T)Read6items>y[,1][,2][1,]1012[2,]78[3,]613>chisq.t
4、est(y)Pearson'sChi-squaredtestdata:yX-squared=1.076,df=2,p-value=0.5839关于独立性的检验对于例9.2那一类问题,要检验的是行和列变量的独立性(independence).当行列变量独立时,一个观测值分配到第个格子的理论概率应该等于行列两个概率之积,即零假设为:在零假设下,它的估计值为而第格子的期望值因此为由此可以得到和上面检验齐性时导出的同样的统计量Q:>y=matrix(scan("E:/data/shop.txt"),3,3,b=T)Read9items>y[
5、,1][,2][,3][1,]837045[2,]918615[3,]413810>chisq.test(y)Pearson'sChi-squaredtestdata:yX-squared=18.6508,df=4,p-value=0.0009203关于独立性检验还可以采用另一个基于多项分布的似然函数的检验统计量,称为似然比检验统计量(likelihoodratioteststatistic).它是用一般的最大似然函数与在零假设下的最大似然的比,取其对数的二倍而得(简称LRT):在零假设下,有自由度为的分布.>a=loglin(y,
6、list(1,2))2iterations:deviation1.421085e-14>a$lrt[1]18.69061$pearson[1]18.65077$df[1]4$margin$margin[[1]][1]1$margin[[2]][1]2>pchisq(a$lrt,a$df,low=F)>pchisq(a$pearson,a$df,low=F)0.0009039180.0009203281§9.2低维列联表的Fisher精确检验假定边际频数(行和列的频数总和)都是固定的B1B2总和A1n11n12n1.A2n21n22n
7、2.总和n.1n.2n..在A和B独立或没有齐性的零假设下,在给定边际频率时,这个具体的列联表的条件概率只依赖于四个频数中的任意一个(因为由给定的边际频数可以得到另外三个).在零假设下,该概率满足超几何分布,它可以写成(对任意的和)例9.3(数据:stroke.txt)要研究目前的中风和以前中风的关系,零假设可以为:“目前的中风和以前的中风病史没有关系(即独立性)”.下面是113个人按照目前和过去中风状况的2×2分类表:以前中风过以前未中风过总和目前中风351550目前未中风253863总和6053113>x=read.table(
8、"E:/data/stroke.txt",header=F)>xV1V21351522538>attach(x)>fisher.test(x)Fisher'sExactTestforCountDatadata:xp-value=0.0