资源描述:
《第十四讲 统计1105班孙铭远 翻译》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第十四讲平移参数的Wilcoxon的置信区间针对两组总体,我们已经讨论了两组基于秩的检验。1,配对数据的Wilcoxon符号秩检验2,独立数据的Wilcoxon秩和检验本章中内容是估计两组数据位置差的置信区间,在两组总体中,可能会出现中位数差异(正如符号秩检验)或仅出现一般的“位置平移”,在任意一个情况下,我们使用符号“△”表示平移参数。14.1回顾两组不同总体均值差的置信区间让我们简单回顾参数分析中,比较两组样本均值μ1μ2时使用的t检验。若我们拒绝原假设H0:μ1–μ2=0,我们的结论就是一个样本与另外一个样
2、本的区别明显(高于或低于),那我们自然就会提出一个问题,它们究竟相差多少?我们通常求得μ1–μ2的置信区间来回答这个问题,置信区间给定了一个范围,在这个范围中我们可以确保存在组间均值差。(想了解更多细节实例,请翻阅3.8)顺着这种思路,我们思考在非参数条件的情况。如你所望,处理方式多种多样(包括一个更为先进的技术,我们将在之后的学习中涉及到)但现在我将介绍一个经常使用的传统方法14.2独立样本时△的置信区间接下来我们将研究独立样本中Wilcoxon秩和检验的置信区间,先介绍它的原因是我们对Wilcoxon秩和检验
3、更熟悉。让我们已饮食习惯数据为例(我保证最后一次)再上一章中运行Wilcoxon秩和检验,我们有充分理由认定A习惯下实际增长速度大于B,下面我们来复习一下操作步骤9>wilcox.exact(A,B,paired=FALSE,alternative="greater")ExactWilcoxonranksumtestdata:AandBW=56,p-value=0.02154alternativehypothesis:truemuisgreaterthan0现在的问题是:A饮食习惯增加的生长速度究竟有多高?首先,
4、我们不要在意均值差(因为Wilcoxon秩和检验不比较均值),而是关注位置的差异,两组饮食习惯AB数据分布的差异记为平移参数,我们记做△,有些人认为△是两组数据分布中位数的差异,但从技术上考虑这并不是△的定义,我们的目的是为了估计△并求得的其置信区间Hodges-Lehmann估计,Hodges-Lehmann估计是△的非参数点估计量,作为检验均值差的备选估计量。对于独立样本,Hodges-Lehmann式所有可能的Xi-Yi形式差值的中位数,其中Xi是首个样本的任意值,其中Yi是第二个个样本的任意值。下面是计算
5、△的例子。例:研究以下来自两个不同群组的相互独立样本这个例子中,m=4,n=3,为估计△,我们建立一个4×3的直线坐标系,其包含所有可能组合,如下所示,括号内即为样本值:△是12组差的中位数,R中点估计△的过程可以使用以下代码表示>x<-c(14,22,31,16)>y<-c(23,19,19)9>diffs<-as.vector(outer(x,y,"-"))>diffs[1]-9-18-7-5312-3-5312-3>median(diffs)[1]-2经计算,从X到Y的总体平移为-2△的置信区间首先,将上例
6、中的差值进行排列>sort(diffs)[1]-9-7-5-5-3-3-13381212将排列值记为D(1),D(2),…,D(12),同第7章表示中位数置信区间的方式类似,△的置信区间表示形式如下(D(k),D(mn+1-k))M为第一个样本的长度,n为第二个样本的长度,k记为kth,我们所做的(与前文类似)从每个排列好的差值两端计算K值,以求得置信区间,置信登机并非由二项分布决定的,我们无须考虑繁杂的数据来源。以下给出R中计算△的运行代码conf.level<-0.95m<-length(x)n<-lengt
7、h(y)diffs<-sort(as.vector(outer(x,y,"-")))mn<-length(diffs)alpha<-1-conf.levelk<-qwilcox(alpha/2,m,n)if(k==0)k<-k+1kcat("Achievedconfidencelevel:",1-2*pwilcox(k-1,m,n),"")9c(diffs[k],diffs[mn+1-k])将其运行于饮食习惯数据例:饮食习惯比较(真的最后最后一次了!)求两组饮食习惯生长水平位置差异95%置信水平下的置信区间解
8、:>A<-c(156,183,120,113,138,145,142)>B<-c(109,107,119,162,121,123,76,111,130,115)>conf.level<-0.95>m<-length(A)>n<-length(B)>diffs<-sort(as.vector(outer(A,B,"-")))>mn<-length(diffs)>HL<-me