第十三讲:统计1105班,孙铭远 翻译

第十三讲:统计1105班,孙铭远 翻译

ID:35990986

大小:64.13 KB

页数:7页

时间:2019-04-29

第十三讲:统计1105班,孙铭远 翻译_第1页
第十三讲:统计1105班,孙铭远 翻译_第2页
第十三讲:统计1105班,孙铭远 翻译_第3页
第十三讲:统计1105班,孙铭远 翻译_第4页
第十三讲:统计1105班,孙铭远 翻译_第5页
资源描述:

《第十三讲:统计1105班,孙铭远 翻译》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、第十三讲Wilcoxon秩和检验13.1简介在上一讲的置换检验中,我们阐述了随机抽样条件下,比较一个独立样本中两组均值µ1,µ2的方法,这种情况下,我们检验的假设是这种形式原假设H0:μ1–μ2=0备择假设:Ha:μ1–μ2>0Ha:μ1–μ2<0Ha:μ1–μ2≠0我们真正需要用置换检验去检验的假设仅是(1)样本是随机选取且独立的(2)数据以区间形式度量(因此均值以及均值差的意义重大)Wilcoxon秩和检验是另一种广泛使用的非参数统计方法,用来比较两组属于Wilcoxon(即符号秩检验的创始人)型的独立总体。为什么我们要介绍这种检验呢?这主要是因

2、为秩和检验与上文的假设不同,基本上来说,Wilcoxon秩和检验仅需要将观测值的秩作为检验统计量,这也就意味着,只有样本的顺序参与分析。基于此,Wilcoxon秩和检验可以检验任何按顺序排列的数据(它同样可以用来检验区间数据,但这样做很可能会丢失样本)13.2次序数据次序数据既是仅按大小顺序排列的数据,但是我们难以确认数据差异的大小,我们曾在抽样调查中见过很多这样的例子,如“利开特”型量表,请看下面的例子例:请选出下列最符合你个人情况的数字非参数统计是即切片面包以来最伟大的事物非常反对反对一般同意非常同意12345这个问题的答案均为顺序的,当你从左向

3、右观察这个量表时,你只能看到同意程度增加的幅度,然而,“非常同意”和“同意”之间的差值我们不得而知。这种距离,或者说变量之间的区间是模糊且非常主观的。这个量表的数字仅仅是为了方便而设置的,我们要清楚的认识到它们是任意取值的。你同样可以任意的用2,5,13,15,29作为你的量表数字,而不是传统的1,2,3,4,5。因此,例如这样基于区间尺度的统计量也同样是任意的。当然,这并不妨碍研究者们使用作为统计量,但你应当意识到这种方式的不足之处。Wilcoxon秩和检验的目的既是仅基于数据的次序探究两个独立样本的问题,下面给出使用条件1.数据是次序的2.数据是

4、区间的,但是存在强烈的异常值导致不可靠我将由下一个例子引出这个检验的推导步骤。13.3检验的推导假定:Wilcoxon秩和检验包含以下假定1.样本独立且随机2.数据至少是顺序的原假设H0:总体变量在1,2组中处在同一位置备择假设Ha:总体变量在1中位置与2不同(双边检验)Ha:总体变量在1中比2大(右侧检验)Ha:总体变量在1中比2小(左侧检验)这些假设,比我们曾接触到的符号秩检验(第8讲)、Wilcoxon符号秩检验(第9讲)的假设更广泛,这主要是因为采用次序作为度量尺度,若我们采用更为严格的假设,如连续数据或同分布,假设就会变成总体中位数的比较(

5、正如第8讲,第9讲)。然后,主要的区别在于样本是独立的,而此时符号检验,符号秩检验是无法使用的。构造统计量:事实上,有很多极佳且有效的统计量可用来检验以上假设,它们都基于组合后样本的秩进行检验。其中一种广泛使用的统计量为W统计量,即W=首个样本的秩和这是一个简单计算W统计量的例子,假设你在比较两种治疗手段的研究中得到以下两组数据首先,无论样本观测值来自己哪一个样本,将它们同意排序,使用平均秩处理打结秩,这是处理后的数据,括号内的是他们的联合秩。对于这个数据,我们的检验统计量是W=3+7+8+1=19(注意我们舍弃了实际的数据,但保留了他们在混合样本中

6、的相关位置)W的含义是什么呢?若原假设H0成立,两个样本中的变量应当相等,因此我们应当能在两个样本中均发现大秩和小秩。若原假设H0不成立,一个样本的变量应当小于另一个样本的变量。所以,若第一个治疗手段产生更小的反应,第一个样本的变量也就小,相应的其秩和W值更小。所以,若第一个治疗手段产生更大的反应,第一个样本的变量也就大,相应的其秩和W值更大。零分布和P值早前的统计著作中对零分布和P值有无穷无尽的赘述,然后我们可以通过置换检验轻松地估计零分布,现在,我将给出整个13讲的核心Wilcoxon秩和检验就是使用W作为检验统计量的置换检验从定义上来讲,任何假

7、设下的P值是样本观测值与原假设一致(或相反)的可能性大小。我们需要通过使用R软件的计算,认识到备择假设的含义及其成立时W的含义,最后与给定的α值进行比较。运行程序:这是使用置换检验(随机排列)进行Wilcoxon秩和检验的逻辑步骤,假定样本1中存在m个观测值,样本2中存在n个观测值。1,将m+n个观测值放入同一群组中2,将所有观测值按从小到大的顺序进行排列,将最小的值记为1,2其次,以此类推。对于打结观测值取平均数3,计算样本的W统计量即W=第一个样本的秩和1,随机打乱混合样本的秩,将前m个样本放入样本12,计算置换后的W值3,将4,5两步重复多次(

8、如1000或10000次),对于右侧检验,P值表示W比实际观测值大或相等的可能性(同样我们也可以针对左侧检验

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。