第十四讲 统计1105班孙铭远 翻译

第十四讲 统计1105班孙铭远 翻译

ID:41516483

大小:95.18 KB

页数:9页

时间:2019-08-26

第十四讲 统计1105班孙铭远 翻译_第1页
第十四讲 统计1105班孙铭远 翻译_第2页
第十四讲 统计1105班孙铭远 翻译_第3页
第十四讲 统计1105班孙铭远 翻译_第4页
第十四讲 统计1105班孙铭远 翻译_第5页
资源描述:

《第十四讲 统计1105班孙铭远 翻译》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第十四讲平移参数的Wilcoxon的置信区间针对两组总体,我们已经讨论了两组基于秩的检验。1,配对数据的Wilcoxon符号秩检验2,独立数据的Wilcoxon秩和检验本章中内容是估计两组数据位置差的置信区间,在两组总体中,可能会出现中位数差异(正如符号秩检验)或仅出现一般的“位置平移”,在任意一个情况下,我们使用符号“△”表示平移参数。14.1回顾两组不同总体均值差的置信区间让我们简单回顾参数分析中,比较两组样本均值μ1μ2时使用的t检验。若我们拒绝原假设H0:μ1–μ2=0,我们的结论就是一个样本与另外一个样

2、本的区别明显(高于或低于),那我们自然就会提出一个问题,它们究竟相差多少?我们通常求得μ1–μ2的置信区间来回答这个问题,置信区间给定了一个范围,在这个范围中我们可以确保存在组间均值差。(想了解更多细节实例,请翻阅3.8)顺着这种思路,我们思考在非参数条件的情况。如你所望,处理方式多种多样(包括一个更为先进的技术,我们将在之后的学习中涉及到)但现在我将介绍一个经常使用的传统方法14.2独立样本时△的置信区间接下来我们将研究独立样本中Wilcoxon秩和检验的置信区间,先介绍它的原因是我们对Wilcoxon秩和检验

3、更熟悉。让我们已饮食习惯数据为例(我保证最后一次)再上一章中运行Wilcoxon秩和检验,我们有充分理由认定A习惯下实际增长速度大于B,下面我们来复习一下操作步骤9>wilcox.exact(A,B,paired=FALSE,alternative="greater")ExactWilcoxonranksumtestdata:AandBW=56,p-value=0.02154alternativehypothesis:truemuisgreaterthan0现在的问题是:A饮食习惯增加的生长速度究竟有多高?首先,

4、我们不要在意均值差(因为Wilcoxon秩和检验不比较均值),而是关注位置的差异,两组饮食习惯AB数据分布的差异记为平移参数,我们记做△,有些人认为△是两组数据分布中位数的差异,但从技术上考虑这并不是△的定义,我们的目的是为了估计△并求得的其置信区间Hodges-Lehmann估计,Hodges-Lehmann估计是△的非参数点估计量,作为检验均值差的备选估计量。对于独立样本,Hodges-Lehmann式所有可能的Xi-Yi形式差值的中位数,其中Xi是首个样本的任意值,其中Yi是第二个个样本的任意值。下面是计算

5、△的例子。例:研究以下来自两个不同群组的相互独立样本这个例子中,m=4,n=3,为估计△,我们建立一个4×3的直线坐标系,其包含所有可能组合,如下所示,括号内即为样本值:△是12组差的中位数,R中点估计△的过程可以使用以下代码表示>x<-c(14,22,31,16)>y<-c(23,19,19)9>diffs<-as.vector(outer(x,y,"-"))>diffs[1]-9-18-7-5312-3-5312-3>median(diffs)[1]-2经计算,从X到Y的总体平移为-2△的置信区间首先,将上例

6、中的差值进行排列>sort(diffs)[1]-9-7-5-5-3-3-13381212将排列值记为D(1),D(2),…,D(12),同第7章表示中位数置信区间的方式类似,△的置信区间表示形式如下(D(k),D(mn+1-k))M为第一个样本的长度,n为第二个样本的长度,k记为kth,我们所做的(与前文类似)从每个排列好的差值两端计算K值,以求得置信区间,置信登机并非由二项分布决定的,我们无须考虑繁杂的数据来源。以下给出R中计算△的运行代码conf.level<-0.95m<-length(x)n<-lengt

7、h(y)diffs<-sort(as.vector(outer(x,y,"-")))mn<-length(diffs)alpha<-1-conf.levelk<-qwilcox(alpha/2,m,n)if(k==0)k<-k+1kcat("Achievedconfidencelevel:",1-2*pwilcox(k-1,m,n),"")9c(diffs[k],diffs[mn+1-k])将其运行于饮食习惯数据例:饮食习惯比较(真的最后最后一次了!)求两组饮食习惯生长水平位置差异95%置信水平下的置信区间解

8、:>A<-c(156,183,120,113,138,145,142)>B<-c(109,107,119,162,121,123,76,111,130,115)>conf.level<-0.95>m<-length(A)>n<-length(B)>diffs<-sort(as.vector(outer(A,B,"-")))>mn<-length(diffs)>HL<-me

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。